【摘 要】
:
随着信息科学技术的发展,各种成像设备已经走进了千家万户,产生了海量的数字图像。数字图像中的文字信息提取是一项非常具有挑战性的任务,也是一个亟待解决的问题。近年来,国际上对自然场景文本检测研究逐渐向基于卷积神经网络的方向发展。但国际上的研究主要基于自然场景英文环境图像,与英文文本相比,中文文本在纹理、结构以及分布方式等方面有许多独特之处,自然场景的中文文本检测应当作为一个单独的方向来进行研究。本文将
论文部分内容阅读
随着信息科学技术的发展,各种成像设备已经走进了千家万户,产生了海量的数字图像。数字图像中的文字信息提取是一项非常具有挑战性的任务,也是一个亟待解决的问题。近年来,国际上对自然场景文本检测研究逐渐向基于卷积神经网络的方向发展。但国际上的研究主要基于自然场景英文环境图像,与英文文本相比,中文文本在纹理、结构以及分布方式等方面有许多独特之处,自然场景的中文文本检测应当作为一个单独的方向来进行研究。本文将中文文本检测分为水平方向文本检测和任意多方向文本检测,分别对不同排列方向的中文检测进行研究,主要研究内容如下:(1)本文对中文文本的采集条件与文本可能存在的自然场景进行了分析,充分理解中文文本与英文文本的不同特点,建立了一个多样化的自然场景中文文本图像数据集,总共包含3600张文本图像,并标注了每一张图像中的中文文本信息,用于本文自然场景中文文本检测方法的训练和测试。(2)本文提出了基于YOLOv3模型的水平方向中文文本检测方法。本文将水平中文文本以一行作为一个整体目标进行标记,使用K-means++聚类算法进行对数据集进行维度聚类,以聚类结果来优化YOLOv3检测模型,实现对自然场景水平方向中文文本检测。经实验验证,本文的优化YOLOv3中文检测模型取得了不错的性能且兼具实时性。(3)本文采用ResNet-101网络作为EAST模型的特征提取网络,实现对多方向中文文本检测。EAST模型可以实现对多方向的文本进行检测,本文采用了ResNet-101替换ResNet-50作为EAST模型特征提取网络,试验了两种网络下EAST模型的中文文本检测效果。实验结果表明,基于ResNet-101的EAST模型在多方向中文文本检测方面取得了更好的效果,同时发现该模型在中文长文本检测方面容易产生过分割的现象,需要进一步的研究。
其他文献
海上分布式作战概念由美国首先提出,并逐渐得到各国认可,我国在分布式协同作战方面同样进行了探索,但体系框架及技术基础尚未成熟。以提升我军我应对强敌的作战能力、指导海
随着新课程改革的不断推进,“立德树人”要求的不断深化,思想政治教育打破了以应试为主要目的和教学出发点的错误理念,更注重以生活实际为逻辑起点、坚持以人为本的价值取向、以指导学生生活实践为最终归宿。这与陶行知先生提出的“生活即教育、社会即学校、教学做合一”的生活教育理念不谋而合。因此在高中思想政治课堂上开展以学生为主体、以面向生活实践为导向、以实践活动为主要载体的生活教育对于提升学生的核心素养,促进学
语音识别在现今的日常生活中应用广泛,语音特征提取是语音识别技术中最关键的过程之一。语音特征提取在面临当前大规模、高计算密度的数据计算问题时,存在着高耗时、低效率的
近年来,大规模图数据处理的需求日益强烈,一些图计算模型被提出,例如Pregel[1]模型,GAS[2,3,26]模型。它们可以分为离线和流式两类。流式图计算引擎有PHISH[4,5],Flink[6,7],
企业的产品绿色度决策行为是企业获取差异化竞争优势的重要手段,也是企业履行社会责任的关键着眼点。随着部分企业主动采取产品绿色度决策,不同绿色度的产品竞争绩效呈现出差异化的涌现特征,同时企业的产品绿色度决策行为也受到了消费者购买需求驱动的影响。一方面,消费者的购买力属性往往是其自身购买需求的首要影响因素;另一方面,消费者的互动特征往往是互动下不同消费者群体购买需求的重要影响因素。为此,本文基于多维度绩
信息技术在英语教学中的应用与整合是教育信息化的发展趋势,这对教师的信息素养提出了更高的要求。以往的研究对象主要为中小学和高校教师,讨论教师信息素养与教学效果相关性
我国老年人口基数大,空巢率高。空巢使传统的家庭养老功能弱化,在精神慰藉方面尤为突出。随着经济社会的发展、养老保障制度的不断完善,空巢老人的物质需求逐渐得到更好的保障,但精神慰藉供需矛盾却日益突显。一方面,空巢老人渴望得到来自子女、亲友、社会的关注和慰藉;另一方面,迫于生活压力和空间距离,子女难以给予留在家中的空巢老人足够的关注。而社区在老年人福利服务方面的工作也未能很好满足空巢老人的精神需求。伴随
雷达嵌入式通信是近些年发展起来的隐蔽通信技术,因其同时具有低截获概率与低检测概率性能而在国内外越来越受到广泛关注。现阶段对雷达嵌入式通信的分析和研究主要基于加性
跨国技术联盟作为企业进行国际合作的一种崭新模式,是知识积累、技术进步、经济全球化等社会环境发展的必然趋势,是增强企业整体竞争力的有效措施。但在联盟过程中一方面由于企业一般不愿意共享作为核心竞争力的技术知识,另一方面跨国企业间存在着文化距离,因此跨国技术联盟间的企业间往往存在利益冲突,并引发相应的风险。在这样的背景下,跨国技术联盟的风险管理问题日益引起国内外研究者的关注。首先,论文对跨国技术联盟知识
数据采集设备作为混合信号处理系统中的重要组成单元,是连接真实的模拟世界和虚拟的数字世界之间的唯一桥梁,是支撑现代信号处理的基石。随着待测频谱宽度和瞬时动态范围的不