论文部分内容阅读
图像中的文字包含许多有用的信息,能够客观反映图像所要表达的内容。因此,图像文字提取对于基于语义的搜索、牌照标识的识别以及数字图像资料管理等都存在着重要的意义。但是,由于图像中的文字可能存在于复杂背景中,受到不均匀的光照以及文字本身大小字体颜色的多样性,使得图像文字提取成为了一个具有挑战性的课题。
本文主要研究了图像中文字提取的算法,主要使用基于边缘的提取方法,以基于颜色的方法为辅助,通过分析连通体性质对候选区域进行粗筛选,再提取三类特征,使用支持向量机对候选区域进行细分类得到最终结果。在粗筛选模块,主要描述了边界提取算法,提出了边缘与颜色混合的文本定位算法;在细分类模块,主要描述了特征的提取以及支持向量机的训练;实验部分,则通过实验数据论证了粗筛选模块的有效性以及特征的可分性。最后,对486张测试样张的处理结果达到93.88%的正确率,83.71%的召回率。
实验结果证明了本文的方法对图像文字提取具有一定的效果,但是由于对处理速度还未做任何优化,所以在这方面还有待改进。