自然场景图像中文本信息检测方法的研究

来源 :天津师范大学 | 被引量 : 0次 | 上传用户:calvin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络技术的不断发展,互联网已经成为人们必不可少的信息分享与传播平台。在近代科学研究、军事技术、工农业生产、医学、气象及天文学等领域中,人们也越来越多的利用图像信息来识别和判断事物,进而解决实际问题,因此,对于图像和视频中文本的检测和定位技术也日渐得到大家的广泛关注。但是,由于自然场景图像文本具有图像分辨率低、图像背景复杂、文本大小、颜色和形状不一的特点,这些都给自然场景图像中文本的检测和定位研究带来了很多困难。  完整的图像文本分析系统包括文本检测、提取和识别三部分。其中位于前端的文本检测和抽取模块对整个系统的性能起着至关重要的作用。由于图像中背景的复杂性和文本位置、大小、字体、颜色、极性和排列等变化性,文本检测和定位是一个具有挑战性的问题。本文基于以上研究背景,结合图像处理和模式识别等相关领域的技术,对自然场景图像中的文本检测和定位方法进行了深入研究,提出了一种具体的自然场景图像中文本检测和定位方法。实验结果表明,相比较已有方法,本文提出的方法在准确率、召回率等方面具有一定优势。本文的主要工作概括如下:  第一,本文研究了目前存在的各种图像文本检测方法,对不同的方法进行比较和归纳,并将基于边缘的文本检测方法应用于本文提出的文本检测方法当中。  第二,提出一种基于MSER和笔划特征结合的文本检测和定位方法。本方法的主要功能是对用户输入的自然场景图像进行检测,并定位出文本所在的区域,最后将处理得到的相关信息展示给用户。该方法先采用MSER方法滤除大部分背景,笔划特征的方法可以在进一步提取文本区域的同时对MSER的结果进行验证,二者结合可以得到更为准确的效果。  第三,在文本检测和定位算法的基础上,设计并实现了一个图像文本检测和定位系统,它的主要功能是根据用户提供的输入图像进行一系列检测,最终定位出文本区域的位置反馈给用户。实验结果表明,该系统具有良好的检测性能。
其他文献
数据广播是近年来所兴起的信息服务的新领域,它整合了互联网和广播电视网,它可以取所有网站作信源,取数字电视做信道,把网站内容整体推送到家。随着数据广播业务的开展、广播
动态心电图自投入使用以来,就以其简单、方便、无创的特点在临床中得到广泛的应用。其主要价值是用于发现并记录在通常短暂心电图检查中不易发现的,及日常生活时发生的心电图
嵌入式实时系统主要面向现实世界中与时间因素相关的应用需求,在工业控制、航空航天和军事设备等众多领域里有着广泛的应用,它所关注的不仅是计算结果在逻辑上的正确性,而且
科技文献中存在着大量的信息资源。如何让科研工作者在研究过程中有效地利用、发现、获取、组织和管理这些信息资源是摆在信息服务工作者面前的难题。知识的高速增长迫切需要
传统的搜索引擎的搜索方式是基于倒排索引的全文检索,也就是根据搜索语句查询索引库中的检索方式,并没有很好地利用搜索语句所表达的含义,这样就不能准确识别出用户的具体需求,势
近年来,由于非线性混沌理论的飞速发展,又因为混沌同步在安全通信领域中的极好应用价值,使得混沌同步成为学者们的研究热点。本文利用理论推导和数值模拟相结合的方法研究了三角
移动自组网(Mobile Ad Hoc Network,MANCET)是由一组具有路由转发功能的移动节点组成,其特点是没有固定的通信设施,网络中的所有节点都是可以移动的,每个节点既是终端又是路由器
随着Internet业务快速增长,语音、数据、视频通信业务的综合化发展,数据流量将超过话音流量。因此,建立高速宽带的波分复用(WDM)全光网络已成为本世纪通信网络的发展趋势。作
在嵌入式领域,随着微处理器性能的提高,系统复杂度越来越高,实时操作系统RTOS(Real Time Operating System)正得到越来越广泛的应用。但是,目前市场上应用广泛的多是一些付费的RT
本文的主要工作是将软件定义网络(Software Defined Networking)与信息中心网络(Information Centric Networking)结合,为互联网从当今的1P网络向信息中心网络转变提供一个过