论文部分内容阅读
随着经济不断发展,银行业务的不断扩大,每天产生大量的票据文档需要处理,若采用人工方式进行处理,不仅效率比较慢,降低核心竞争力,同时也加重了银行的负担。为了提高效率,降低成本,银行对于业务处理的自动化要求越来越高,尤其迫切需要实现对票据的自动化处理。票据的智能自动化处理是银行业务电子化的核心,采用模式识别技术对票据文档进行自动化处理是现在的热点研究方向,根据票据图像完成各种要素的提取,并且将数据提供给后续其他业务使用。 本文提出了一种实现票据文档处理的算法,实现了票据的自动化处理。票据的处理包括票据的检索分类,票据手写字符区域的提取,票据手写字符识别等内容,本文对于票据处理中应用到的算法进行阐述,并且对其中一些问题进行了研究,提出了改进算法。本文的创新点主要体现在: 1)实现了基于特征点的票据检索分类算法。算法同时适用于非倾斜与倾斜的票据图像,且可达到实时处理的要求。 2)对于票据的手写字符区域提取,采用了图像仿射的算法,将票据图像与模板图像进行仿射变换得到手写字符区域,对于倾斜的票据图像同样适用。 3)针对粘连手写字符串的分割,提出了基于MSER的字符定位分割算法,与投影法结合,可以得到良好的效果。 4)对于手写字符识别率不高的问题,改进手写字符特征提取算法,采用了SVM分类器,大大提高了字符的识别率。 实验表明,基于SIFT特征点的图像分类算法准确率在有限的数据样本库中可以达到100%,对于手写字符区域提取,采取仿射变化,然后两幅图像做差可以得到手写字符图像,方便进行后续的操作。经过改进的字符特征提取算法,提高了手写字符的识别率,准确率最高可达到98%。以上的改进算法,很好的达到了票据自动处理的要求。