论文部分内容阅读
二值化是文档自动处理系统的一个关键预处理过程,直接影响系统的整体性能。低质量文档是由复杂背景和弱笔画等诸多因素引起的,其二值化是当前文档处理研究的热点和难点。本论文分析了文档质量下降的主要原因,重点对具有弱笔画、墨迹浸润现象以及背景亮度深浅不一的低质量文档图像二值化方法进行研究。本文研究了Su提出的基于局部最大值和最小值的文档图像二值化方法,针对其处理弱笔画的不足提出了一种新的基于梯度归一化的文档图像二值化方法。首先根据归一化梯度检测字符笔画的边缘点;然后通过极值滤波获得笔画的边缘区域;最后计算笔画边缘区域的局部阈值并进行二值化。与Otsu方法、Niblack方法以及Su方法进行了对比实验,结果表明,本文提出的基于梯度归一化的二值化方法不仅能够有效的检测出字符信息,而且产生的噪声较少。视觉注意机制在目标检测、图像压缩和图像检索等领域中得到了广泛的应用,但是在文档处理领域中的应用却鲜有报道。本文从视觉注意机制的角度出发,分析了文档图像的特征,并对视觉注意机制在文档图像二值化上的应用进行了探索,提出了基于显著图的区域全局阈值和局部阈值两种二值化方法。其中,区域全局阈值方法是对字符区域采用统一的阈值进行二值化,由于字符区域大小与字符的分布有关,所以该方法的效果不太理想,实验结果表明该方法优于常用的Otsu方法和Niblack方法,但是劣于Su方法;局部阈值方法是对字符区域采用局部阈值进行二值化,实验结果表明,该方法的处理效果要优于Otsu方法、Niblack方法以及Su方法。