基于卷积神经网络的弯曲文本检测方法研究

来源 :江苏大学 | 被引量 : 0次 | 上传用户:jyx781004
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自然场景文本检测是计算机视觉领域当中的一个热门研究,在文本翻译、信息录入、盲人辅助、机器感知、自动驾驶等场景都有广泛应用。目前针对自然场景中水平文本和倾斜文本的检测已经有一些较好的方法被提出来,但是由于自然场景的复杂性,该领域仍有相当多的问题还未能得到较好的解决。比如,有些带有艺术效果的提示牌,其中的文本可能具有不同的尺度,而且这些不同尺度的文本通常呈弯曲形状,如何检测这部分多尺度的弯曲文本,已有的文本检测方法做得还不够好。由此可见,自然场景中文本检测方法的研究仍然具有较大的意义。本文的研究基于以上自然场景文本检测中存在的问题进行展开。首先阐述了自然场景文本检测的研究现状,对主流的自然场景文本检测算法的优点与不足进行了分析,针对自然场景中多尺度弯曲文本检测,本文提出了一种新的解决方法。该方法可分为两个步骤,第一步是对图片中不同尺度大小的文本位置进行预估,这一步主要是为了防止文本漏检;第二步在文本预估位置上进行方向和形状上的优化,精修最终的文本框。论文的主要研究内容如下:(1)为解决多尺度弯曲文本检测中的漏检问题,本文针对性地提出了MLFE-CTPN方法,该方法基于CTPN方法改造而来,将图片中不同尺度的文本进行覆盖,有效解决了现有方法对图片中多尺度文本的漏检问题。MLFE-CTPN方法沿用了CTPN的微分思想,将文本行切分为文本片段进行检测。该方法的创新点在于对CTPN所使用的网络骨架VGG16进行了改进,将VGG16的全连接层都改为卷积层,并在VGG16的末端增加了卷积层,将特征提取层增加到6个。最后在数据集上进行文本行检测,实验结果表明,改进后的方法有效地解决了文本漏检问题。(2)MLFE-CTPN方法有效解决了文本漏检问题,不过该方法没有专门针对文本形状进行设计,对弯曲文本的定位做得不够精确,为此,本文提出了MCPN方法。该方法不仅改善了现有方法对图片中多尺度文本的漏检问题,还能够精确地检测自然场景中的弯曲文本。MCPN方法的创新之处在于:1)对数据集进行了重新标定,将长文本分割为小的文本片段,标注每个文本片段的中心点坐标、宽、高和倾斜角度,同时还标注了文本片段的连接信息。2)在特征提取阶段使用改进过的VGG16网络,3)通过一种检视所有的文本片段及其连接信息的连接算法来构建文本行。实验表明,该方法能够有效地检测自然场景中的多尺度弯曲文本。(3)在MCPN方法的基础之上,采用tensorflow深度学习框架来搭建网络模型,实现了自然场景弯曲文本检测系统的主要算法,最后将系统友好地展示了出来。
其他文献
水稻真菌病害在线智能检测是国家《数字农业农村发展规划(2019-2025年)》的必然要求,但研究发现稻瘟病、稻曲病等真菌病害主要依靠孢子在空气中传播,速度快、危害大。但是以气传孢子为媒介的水稻真菌病害检测存在几个弊端:(1)空气中微生物成分复杂,包含花粉、孢子、PM2.5、气溶胶等体积位于几纳米到几十微米的颗粒态物质,水稻真菌孢子难以直接分离。(2)水稻真菌孢子浓度低,即使在病害爆发阶段,空气中浓
人口的增长以及人类活动的加剧,导致了物种栖息地的日渐退化,种群数量的动态演化和生态系统的可持续发展成为了研究热点。本文考虑到种群个体的异质性,为更好表述种群间的相互作用,研究种群个体间的复杂联系。本文基于复杂网络理论、微分方程定性理论以及复杂网络上的传染病模型,将种群模型与耦合复杂网络相结合,利用生态系统的结构特征与耦合网络的良好相性,建立了具有网络特征的种群动力学模型,并对该模型进行动力学分析和
核聚变堆的第一壁结构材料直接面对等离子体,需承受14.1 Me V高能中子辐照,故须具有良好的抗辐照损伤性能。第一壁结构件往往需要钨极氩弧焊焊接成形,而焊缝是焊接接头中的薄弱区域之一。中国低活化马氏体(CLAM)钢是核聚变示范堆第一壁结构材料的首选合金之一,针对CLAM钢焊缝的辐照损伤问题开展研究具有重要意义。本研究将运用He+离子辐照模拟中子辐照,分析辐照剂量(5×1015、5×1016、1×1
精准农业中的实时混药与精准施药是促进农药减施增效的两大重要手段。实时混药与变量喷雾的一体化协调工作可进一步提高农药利用率、保护操作人员安全和减少农药污染。本文设计了基于植株靶标喷施量需求的实时混药和变量施药同步协调控制系统,实现低量实时混药与变量喷雾精确施药,本文主要研究内容如下:(1)针对实时混药作业中高精度混药比和低混药残余量的需求,设计了一种基于水、药流量同步控制的实时混药系统。该系统主要由
随着现代科学技术的进一步发展,人们的日常活动对电力的需求呈现出了逐渐增加的趋势。而精确有效的区域电力负荷预测研究,不仅能帮助供电企业制定合理的电力分配计划,而且能提高电力调度效率以及降低电力输送损耗。因此,寻找一种具有较高精度的短期电力预测方法显得尤为重要。本文从沛县区域、工业园区和企业三个不同角度开展了短期电力负荷预测研究,分析了电力负荷、气象、时间等变量对负荷预测的影响,明确了负荷预测的输入参
高密度脂蛋白(HDL)中含量最高的载脂蛋白为ApoA-Ⅰ蛋白,ApoA-Ⅰ蛋白可通过与肿瘤细胞膜表面的SR-BI受体结合,引导高密度脂蛋白向肿瘤细胞输送胆固醇。现已报道的ApoA-Ⅰ模拟肽4F具有与ApoA-Ⅰ蛋白相似的生物学功能,且被证实具有抗肿瘤作用。研究发现HDL受体SR-BI不仅在多种肿瘤细胞上高表达,而在正常的肝脏、乳腺和前列腺部位的表达量也较高,利用ApoA-Ⅰ的靶向特性给药有可能会导
作为新能源汽车的主要动力源,锂离子电池的使用性能和安全性能得到了广泛的关注。受限于新能源汽车的体积,电池包通常密封在狭小的电池箱中,若模组在大倍率充放电过程中的产热未能迅速排出,容易出现局部电池温升过高、温差过大等问题,严重时会导致爆炸等安全事故。因此,一个安全高效的电池热管理系统至关重要。本文对圆柱18650电池构建三维电化学热耦合模型,研究不同因素对模组液冷散热性能的影响,并进行相关优化,具体
铁铬铝合金具有生产成本低廉,耐高温腐蚀性能较好,热膨胀系数低等优点,是汽车尾气净化器催化剂载体的理想材料。但在热循环、热疲劳等极端环境下,氧化膜易发生开裂、剥落等,导致其使用寿命较短,严重制约了铁铬铝合金的应用。本文通过添加稀土La、Ce改善Fe25Cr5Al合金的抗高温氧化性能,在实验的基础上结合第一性原理计算探究Fe25Cr5Al合金的高温氧化机理及稀土的作用机制。热力学计算分析及合金微观分析
软件产品线(Software Product Line,SPL)旨在通过重用通用功能来开发相关的软件产品,SPL中的产品通过其功能特征来区分,其功能特征定义了软件系统的功能和行为。SPL通常通过特征模型来表示,特征模型根据特征及其之间的关系来捕获SPL所有可能产品的信息。软件产品线中,可以将SPL测试用例定义为要测试的产品线的产品,SPL中的大量功能组合可能导致成千上万甚至数百万种不同的产品,这样
Nd-Fe-B永磁体因其具有高的综合磁性能而得到广泛应用。将储量丰富且价格低廉的Ce应用于Nd-Fe-B磁体以制备高性能(Nd,Ce)-Fe-B磁体,既可以降低磁体的制造成本,又能够促进稀土资源的平衡利用。然而,低的矫顽力和温度稳定性一直是限制(Nd,Ce)-Fe-B磁体应用的难题。通常通过扩散重稀土元素(Dy、Tb等)形成具有高磁晶各向异性场的硬磁壳层来提高磁体的矫顽力和温度稳定性,但这不仅加剧