论文部分内容阅读
随着数字图书馆的兴起、多媒体信息检索和Interact技术的发展,特别是色彩被越来越广泛的应用,基于彩色图像的字符提取受到越来越多的重视,并应用于Web搜索、复杂文档的自动处理和各种图像数据库的检索等信息管理方面。图像中所包含的文本信息具有很重要的意义,通常形成对相关图像内容的简练描述或说明。自动定位图像中的文本所在的位置,并提取这些文本的字符信息,通过对它们的识别和分析,对于图像理解、检索查询是很有帮助的。对于彩色图像中的字符来说,其字符排列有序,字体颜色基本相同,最重要的是字符本身与背景之间存在着明显的边缘轮廓。因此在对彩色图像中的字符进行提取时,有效利用字符的上述特点是十分重要的。本文通过分析彩色图像滤波的一般方法,在借鉴传统矢量中值滤波方法的基础上,提出了一种基于矢量中值滤波的改进算法。该算法融合了线性均值滤波和非线性矢量中值滤波两种方法,对孤点噪声和单像素宽的细条纹都有较好的抑制作用,能有效地保护图像的边缘信息,滤波后不会出现新的颜色。本文结合颜色距离和Sobel边缘检测,提出了一种基于颜色距离的Sobel彩色边缘检测方法,并用其对经过滤波的彩色图像处理进行边缘提取,取得了较好的效果;本文针对光照严重不均、有色彩扩散和模糊现象的复杂彩色图像,提出了一种快速分割目标和背景、获得较高品质二值图像的方法。在对本文提出方法进行了比较透彻的阐述后,在一个简化的方案模型基础上,详细描述了彩色图像字符提取系统的处理流程:图像预处理、彩色边缘检测、阈值计算及二值化、字符分割和轮廓提取。并通过实验验证了本文提出的方法的有效性。