论文部分内容阅读
随着网络技术的不断发展,互联网已经成为人们必不可少的信息分享与传播平台。在近代科学研究、军事技术、工农业生产、医学、气象及天文学等领域中,人们也越来越多的利用图像信息来识别和判断事物,进而解决实际问题,因此,对于图像和视频中文本的检测和定位技术也日渐得到大家的广泛关注。但是,由于自然场景图像文本具有图像分辨率低、图像背景复杂、文本大小、颜色和形状不一的特点,这些都给自然场景图像中文本的检测和定位研究带来了很多困难。 完整的图像文本分析系统包括文本检测、提取和识别三部分。其中位于前端的文本检测和抽取模块对整个系统的性能起着至关重要的作用。由于图像中背景的复杂性和文本位置、大小、字体、颜色、极性和排列等变化性,文本检测和定位是一个具有挑战性的问题。本文基于以上研究背景,结合图像处理和模式识别等相关领域的技术,对自然场景图像中的文本检测和定位方法进行了深入研究,提出了一种具体的自然场景图像中文本检测和定位方法。实验结果表明,相比较已有方法,本文提出的方法在准确率、召回率等方面具有一定优势。本文的主要工作概括如下: 第一,本文研究了目前存在的各种图像文本检测方法,对不同的方法进行比较和归纳,并将基于边缘的文本检测方法应用于本文提出的文本检测方法当中。 第二,提出一种基于MSER和笔划特征结合的文本检测和定位方法。本方法的主要功能是对用户输入的自然场景图像进行检测,并定位出文本所在的区域,最后将处理得到的相关信息展示给用户。该方法先采用MSER方法滤除大部分背景,笔划特征的方法可以在进一步提取文本区域的同时对MSER的结果进行验证,二者结合可以得到更为准确的效果。 第三,在文本检测和定位算法的基础上,设计并实现了一个图像文本检测和定位系统,它的主要功能是根据用户提供的输入图像进行一系列检测,最终定位出文本区域的位置反馈给用户。实验结果表明,该系统具有良好的检测性能。