论文部分内容阅读
长期以来,由于受到业务和技术条件的制约,我国支票基本只在同城范围内使用,不能适应区域经济发展和人们日益增长的多样化支付需要。中国人民银行根据我国支票使用现状及发展趋势,借鉴国际支票截留的先进经验,建成了全国支票影像交换系统,实现了支票在全国范围的互通使用。企事业单位和个人持任何一家银行的支票均可在境内所有地区办理支付。目前,该系统运行稳定,全国支票使用量正在逐步的增加,但这也给银行业务带来很大的工作量和压力。因此越来越多的学者已经开始重视并研究影像化支票自动识别系统,并希望通过此系统来解决这一问题。而在银行的影像化支票识别系统中,支票图像预处理占有非常重要的地位,其实现的效果将直接关系到识别系统性能的优劣,因此关于影像化支票识别系统中的预处理技术的研究有着非常现实的意义。在对多种支票预处理的方法进行调查和研究后,本文在总结前人方法的基础上提出了一些在支票识别系统中需要用到的票据图像预处理技术,涉及到四个方面:支票的倾斜校正与二值化;支票中小写金额栏中的框线检测与去除;框线去除后的小写金额栏图像的平滑去噪;小写金额栏图像中的阿拉伯数字串的切分。本文的主要研究工作集中在支票的倾斜校正与二值化、小写金额栏框线去除和小写金额栏图像中阿拉伯数字串的切分这几部分:1.在获取支票图像过程中,由于在设备采集过程中人为因素和扫描仪走纸机械误差等的影响,可能会出现某种程度的倾斜,这会给后续的图像单元格的定位、字符切分、字符识别的精度等图像处理与分析带来很大的困难。因此,图像的倾斜校正在图像预处理中是非常重要的一部分,本文中首先对直线检测常用的一些方法进行研究,并选取Hough变换作为本文的直线检测方法。在检测到直线后,并计算出图像倾斜的角度,按照计算的倾斜角度完成图像的倾斜校正。在图像二值化方面,本文在对常见的图像二值化算法进行了研究后,选取二次阈值分割法作为本文的图像二值化算法。2.在小写金额栏图像中的框线去除方面,通过在对相关文献和具体问题研究的基础上,提出了一种改进的框线检测和笔划填补算法。基本思想为:(1)从支票版面分析可以得知,在小写金额栏中,垂直框线之间的距离所差无几。根据这一先验知识,使用投影法找到垂直框线所在的位置。并根据垂直框线所在位置,找出周围垂直投影灰度值之间的渐变点,从而确定垂直框线的宽度。水平框线的检测与宽度确定与垂直框线的方法相似。(2)由于数字字符与框线存在相交的现象,在框线去除后,对字符笔划会有一定程度上的损伤,需要对字符笔划进行填补。本文在对前人算法研究的基础上,提出了一种按照字符笔划方向进行填补的改进算法。3.在小写金额栏图像中阿拉伯数字串切分方面,提出了一种改进的滴水算法。该改进算法的基本思路为:(1)在已经确定了每条框线的位置与宽度的前提下,根据框线与字符笔划之间的关系,来确定起始切分点以及切分方向;(2)然后进行下一步寻址策略:首先需要确定字符笔划的方向,再根据笔划方向来确定下一步寻址策略的优先级,从而完成阿拉伯数字串的切分。本文第一章介绍了支票预处理技术的研究背景,国内外研究现状以及研究方法,并对支票识别系统进行了简要介绍。说明了在支票识别系统的预处理技术中的难点和其广阔的应用前景。第二章介绍了支票识别系统预处理中的倾斜校正和二值化技术,在对前人方法的研究的基础上提出了自己的二值化算法。第三章中研究了常见的框线检测的算法,并提出了自己的框线定位方法,并在前人笔划填补方法的基础上进行了改进,完成笔划填补。第四章介绍二值图像的平滑去噪算法,并提出了几种新的应用于二值图像平滑去噪的模板。最后,介绍了支票小写金额栏中的阿拉伯数字串切分算法,并在滴水算法的基础上进行了改进,从而完成阿拉伯数字串的切分,并对切分后的字符图像进行了规范化操作。