自然场景图像中的文本定位

来源 :北京邮电大学 | 被引量 : 1次 | 上传用户:beanmilk
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在自然场景图像中有很多的图像信息,同样也有很多的文本信息。这些文本信息对于场景中内容的理解起着十分重要的作用。自然场景图像中的文本定位具有重要的研究意义,同时也是也是很有挑战性和难度性研究内容。一般来说,图像背景比较复杂,文本处光照情况变化剧烈,文本中字体的大小不一、亮度不一、颜色多样、字体间的间距不同、对比度差异、排列方向不同和字体纹理差异等,还有拍摄导致的透视形变等因素都增加了文本定位的难度。但是,自然场景图像中的文本定位可以在很多应用场合中起作用,可以用于图像和视频的检索,也可以用于网络的搜索,也可以用于图像的标注,同时对于图像的理解也有帮助。对图像中的文本进行定位是图像文本识别中特别重要的一个环节,文本定位的结果直接决定了文本识别系统的识别结果的准确性。本文对自然场景图像中的文本定位进行了研究,提出一种基于最大稳定极值区域和笔画宽度转换的文本定位方法,达到了较好的定位效果。本文利用最大稳定极值区域(MSER)算法从图像中提取连通区域,训练AdaBoost分类器来判断所提取的连通区域对是否相邻,根据它们的邻接关系进行聚类得到文本候选区域。基于文本区域是由笔画宽度大致相当的像素组成的假设,我们对候选文本区域进行笔画宽度转换(SWT)操作,然后根据笔画宽度特征设计非文本过滤器,对得到的候选文本区域进行筛选,去除其中的非文本区域,得到文本定位的结果。本文使用ICDAR2003数据集和评价方法对本文算法进行测试和评价,并和其他的文本定位算法进行比较。根据本文的实验结果可以得出以下结论:本文所提出的文本定位方法可以对图像中的文本区域进行准确定位,同时该方法具有较大的实际应用价值。
其他文献
深部岩石爆破工程,由于受自重应力和构造应力等的作用,岩体处于高地应力状态,在高地应力和爆炸冲击荷载的共同作用下,岩石中的应力分布、岩石的破裂破坏等都和一般工程爆破不同。为更好地研究深部岩石爆破时岩石的破坏特性以便提高爆破效果,通过理论分析与模型试验相结合的方法进行不同围压下爆炸应力波的传播规律的研究,设计制作边长为375mm的立方体混凝土试块,预埋应变砖,采用超动态应变测试系统进行距爆源不同距离点
网络的急剧膨胀和应用组合的不断扩充,已逐渐使得垂直封闭的传统网络架构难以追赶新业务的需求。软件定义网络(Software Defined Networking,SDN)作为一种控制面和数据面逻辑
随着无线通信技术的飞速发展,对于无线通信的服务需求也越来越高,以至于无线频谱资源日趋紧张。认知无线电技术的提出,有效的解决了这一问题,得到了学术界的广泛关注。在认知
随着互联网和软件技术的快速发展,计算机技术不仅仅走进我们生活的方方面面,也悄然地改变了我们的生活方式。随着各式各样的在线服务平台逐渐覆盖我们生活的各个领域,我们的
随着互联网的发展,越来越多的消费者选择在电子商务网站上购买产品或服务。由于电子商务缺乏实体体验,为了做出正确的购买决定,消费者往往通过参考网络口碑来制定购买决策,因
本文分为五部分,第一章为文献综述,中国是一个情理社会,对中国人“关系”的研究自改革开放以来迅速兴起,国内外学者从各种角度对此进行了理论的阐述和方法论的探讨。本文通过
将机器视觉技术应用到机械零件测量领域不仅可以克服传统测量方法所带来的应力变形,而且能够达到高精度与快速测量的要求,适用于薄壁件,复杂件及异型件等的测量。边缘作为视
近年来室内环境下基于位置的服务在移动应用市场上的需求与日俱增,室内定位技术的开发成为国内外的研究热点。其中基于WLAN指纹的相关技术由于实现简单且无需部署额外设备而
随着经济全球化进程的加快,我国与国际间的进出口贸易规模也在逐渐扩大,我国已成为全球经济的重要组成部分。但在经济和贸易快速发展的背后是我国能源消耗的形式不容客观,大
互联网的迅猛发展推动了中国农林信息化由数字农林跨入智慧农林的新阶段。智慧农林更加注重各个环节、各种资源、各项业务的深度整合、集约共享和业务协同,通过智慧农林的实