【摘 要】
:
近年来,文本识别与文本检测技术不断发展,越来越多的针对特定数据集的方法被提出。文本识别和检测方法在深度学习时代之前主要是提取低级或中级手工制作的图像特征,这需要繁琐和重复的预处理和后处理步骤。由于手工制作的特征的表现能力有限和过程的复杂性,这些方法很难处理复杂的情况。而基于深度学习的方法优势在于:自动特征学习可以使我们免于设计和测试大量潜在的手工特征。目前,基于深度学习的方法被广泛运用,多场景下的
论文部分内容阅读
近年来,文本识别与文本检测技术不断发展,越来越多的针对特定数据集的方法被提出。文本识别和检测方法在深度学习时代之前主要是提取低级或中级手工制作的图像特征,这需要繁琐和重复的预处理和后处理步骤。由于手工制作的特征的表现能力有限和过程的复杂性,这些方法很难处理复杂的情况。而基于深度学习的方法优势在于:自动特征学习可以使我们免于设计和测试大量潜在的手工特征。目前,基于深度学习的方法被广泛运用,多场景下的文本识别与检测准确率也得以提高。但是,在真实世界开放场景下,复杂背景、多样语种、遮挡文本、扭曲文本等问题成为了该领域研究工作的难点。因此,针对不同结构的文本,只有使用特定的深度学习网络结构和算法,才能提高多场景文本识别和检测准确率。在我们周围,汉字字符四处可见。例如街道的路牌、各式各样的牌坊等。而汉字字符识别和检测技术也确实便利了我们的生活。相对于其他文字,汉字字符种类多、字形相近的文字较多,因此检测和识别难度更大。本文主要研究将深度学习中的主流文本识别与检测算法应用到多场景汉字字符的识别与检测中。多场景汉字字符识别与检测包含识别与检测两个任务,检测是比识别更具有挑战性的任务。基于现有深度学习的文本识别与检测算法,本文提出了多种应用于多场景汉字字符识别与检测的方法,通过实验进行性能对比,并进行实验效果分析,最后提出可改进的方案。主要创新点如下:利用当前在文本识别与检测数据集中性能较好的基于深度学习的算法,研究在相同汉字字符数据集下,不同方法在多场景汉字字符识别与检测中的性能。为了提升多场景汉字字符识别与检测的性能,我们将分析各种文本识别与检测算法的结构,并进行相应的调整,使其能适用于多场景汉字字符识别与检测任务。通过实验对不同算法的性能进行对比和分析,最后提出可改进的方案。基于深度学习的文本识别与检测方法层出不穷,针对特定数据集的算法对比也不在少数,然而文本识别与检测的综述文献却寥寥无几,特别是汉字字符识别与检测。本文通过对比不同方法的实验结果,并分析不同算法的原理和改进方案,填补当前该领域的空白,使我们能够在现实的应用中更好地部署多场景汉字字符识别与检测系统。
其他文献
近年来,随着移动互联网和物联网迅猛发展,网络攻防的态势日益严峻。恶意代码原先主要来自于个人编写,如今逐渐转变为以团队与组织为单位,开始规模化与协作化开发。恶意代码的
新一轮课程改革提出发展学生的核心素养,如何通过教育实践培养学生的核心素养受到了广大教育研究者和一线教师的广泛关注。关注学生长期、全面发展的深度教学被视为发展学生核心素养的有效途径,而教师掌握的深度教学的学科教学知识——DTPCK(Deep Teaching Pedagogical Content Knowledge)是其教师知识的重要组成部分,也是其顺利开展深度教学的关键。通过对初中物理教师DTP
海口12345政府服务热线是以电话、微信和网站等为载体来处理本市市民大量求助、咨询、投诉和建议的平台。海口 12345热线开通已1 1年。年平均热线电话量约27万次,日平均电话量1200次,拥有丰富的热线运营经验。目前,海口 12345热线已并入全市88个热线会员单位(市、区级)。热线类型分为六大类,共431个子项目,主要涉及农林牧渔、社会管理、公共服务、经济综合、政务建设、综合等六个方面。由于海
目的:本研究采用前瞻性随机对照设计方案,观察西医组和中西医组在慢阻肺急性加重期,中医辨证为痰热壅肺证患者的治疗过程中,临床症状、免疫与炎症等指标的改变,客观评价西医常规治疗+清金化痰汤的疗效及安全性,为急性加重期(痰热壅肺证)的慢阻肺患者,提供一个更为有效、安全、规范的中西医结合治疗方案,而且也为临床的中西医结合治疗慢阻肺急性加重期(痰热壅肺证)提供更多的循证医学依据。方法:采用前瞻性随机对照研究
本文主要对Absidia sp.D38s菌产的丹酚酸B酯酶进行了分离纯化,测定了该酶的分子量,研究了其酶学性质。并做了其发酵产物的分离与纯化。制备了底物丹酚酸B,利用Sepabeads SP20
目的:基于天然牙本质制备用于牙本质再生的磷灰石支架材料,研究牙本质的无机成分与功能化的管状结构对牙髓干细胞(DPSCs)形态和分化的影响。方法:制备含有牙本质小管结构和无
近年来,大量的氧化锌纳米颗粒(ZnO NPs )已被应用于半导体领域、塑料助剂、颜料、化妆品等,这很可能造成ZnO NPs 释放到环境中。研究表明,我国现有污水处理厂所用污泥对未被
基于Landau-de Gennes理论,利用松弛迭代方法,研究了一类纺锤状(tactoids)液晶微滴内液晶分子的分布情况。本文主要研究不同条件下纺锤结构中液晶分子的极角、扭曲角的变化情
随着科技的快速发展,人们对生活质量的要求也越来越高,智能家居应运而生。目前市面上的智能家居系统仅能提供一些家居环境的监控和电器的远程控制或者语音控制,但是还没有达到一种真正的智能,需要人来进行控制。随着人工智能的高速发展,将人工智能和物联网技术相结合,能够打造一个真正智能化的家居系统。本文开发了一种基于用户习惯的智能家居系统,即智能家居系统能够根据用户的习惯而造成的不同环境数据进行学习从而对家电进
图像标记的任务是将图像中每个像素标记到它所属的标记类别,它是场景理解的重要步骤和基础,在计算机视觉领域有着重要的作用。行车视角捕捉到的交通场景图像信息能准确的记录