自然场景图像文本检测算法的研究与改进

来源 :福州大学 | 被引量 : 1次 | 上传用户:lz261433
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本检测是许多文本识别应用的必要前提,随着手机等应用设备的日益普及,图像成了人们记录生活的重要载体,特别是自然场景图像。虽然OCR文字识别技术已经相当成熟,但是对于图像中文本的检测,它所面向的图像一般是文档图像,文本背景单一且文字和背景能够很容易地进行区分;而自然场景图像中文本形状不一,背景复杂且其中包含一些与文本相似的内容,因此自然场景图像的文本检测具有较大的难度。基于最大稳定极值区域(MSER)的检测方法是目前研究的热点,本文对该类方法进行了分析与研究,提出了新的分类特征,并将深度学习的思想应用到文本检测中,有效地提高了自然场景图像的文本检测效率。主要研究成果如下:首先,提出了一种引入矩和纹理特征的场景文本检测算法,通过在分类器中引入新的特征,更好地描述了文本的几何特征和纹理特征,提高了分类器的分类准确率。算法在候选字母剪枝阶段通过一个引入Hu矩特征的字母分类器来删除非字母候选,在保留字母的同时有效地减少了非字母候选的数量:文本分类阶段,算法在文本分类器中引入了共生纹理来描述文本的纹理特征,有效地提高了文本检测的召回率。为了进一步提高文本检测结果的准确率,在前述基于矩和纹理特征的算法基础上,提出了一种基于深度学习的场景文本检测算法。算法利用深度学习具有高分类准确率的特点,在文本分类阶段通过一个深度置信网络来对候选文本进行分类,有效地提高了文本检测的准确率。为了提高深度置信网络训练图像的质量,算法采用中值滤波算法对训练图像进行去噪处理,减少了图像噪声的干扰。与同类的基于最大稳定极值区域方法以及其他自然场景图像文本检测算法的比较结果表明,本文算法在准确率和召回率上都取得较好的结果,在f-measure值上相比其他算法有较大的提高,是一种有效的自然场景文本检测算法。
其他文献
与传统的半导体量子点相比,碳基量子点作为一种新兴的碳纳米材料,因其低毒性,优越的荧光、化学发光和电化学发光性质,良好的光稳定性及生物相容性,表面易修饰等特点而被广泛
2020年12月,习近平总书记在中央政治局民主生活会上提出不断提高政治判断力、政治领悟力、政治执行力的重要论述,又先后在省部级主要领导干部学习贯彻党的十九届五中全会精神
在庆祝建党百年华诞的重大时刻,在“两个一百年”奋斗目标历史交汇的关键节点,全党集中开展党史学习教育,十分必要、十分及时,是一次触及灵魂的思想淬炼,也是一场融入血脉的精神洗礼,更是再次整装出发的加油续航。  习近平总书记在今年2月20日党史学习教育动员大会上强调:“全党同志要做到学史明理、学史增信、学史崇德、学史力行,学党史、悟思想、办实事、开新局,以昂扬姿态奋力开启全面建设社会主义现代化国家新征程
本文以弹性波动理论为基础,结合多个极坐标系统方法和构造裂纹的方法研究了受到SH波作用下弹性半空间凹陷地形下圆形夹杂、圆形孔洞与相邻裂纹的反平面相互作用问题。首先需
水彩画是以水为媒介的绘画艺术,水彩风景画对人文情怀的传达及时代特征的显现具有优秀的表现力。由于受到怀乡情思的触动和北方冰雪文化地域特色的引发,因此选取了家乡冬雪场
钙钛矿结构稀土氧化物,如锰氧化物、钴氧化物和铬氧化物中具有多种磁相互作用,表现出丰富的物理性质,如磁电阻、磁熵变、交换偏置、负磁化、自旋重取向等效应。在锰氧化物和
环氧丙烷(PO)是重要的有机化工产品,主要生产聚醚多元醇、丙二醇和丙二醇醚,广泛应用于聚氨酯泡沫、聚酯和溶剂等行业。目前工业生产主要是氯醇法、哈康法及过氧化氢氧化法等,
柴油机尾气碳烟颗粒物(PM)造成的环境问题日益严重,是近年来雾霾天气频发的主要元凶。钙钛矿氧化物在碳烟颗粒物催化燃烧方面占有举足轻重的地位。本论文采用贵金属掺杂和激光
背景:膝关节炎症的终末期转归是膝关节畸形与运动功能丧失,为了解决这一问题,提高患者生活质量,目前国际公认的最佳治疗手段是人工膝关节置换术。在人工膝关节置换术的进行过
数字信号处理问题无处不在。信息科学已渗透到所有现代自然科学和社会科学领域。二十世纪八十年代以来,随着集成电路技术的飞速发展,使得硬件处理数字信号得以实现,从而加速