金融票据OCR系统训练样本挑选方法的研究

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:jchangmafco
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该论文在国家863计划项目"金融票据OC系统中的关键技术研究"的基础上,结合实际项目的应用,比较详细地论述了该系统中手写汉字的识别部分以及手写汉字训练部分的研究现状.对于识别部分,论文详细介绍了手写汉字识别部分的预处理部分、特征抽取部分、识别算法原理以及基于余弦整形变换的多模板匹配手写汉字识别方法,并且通过实际测试证实了该方法的有效性.对于系统的训练部分,论文主要是针对训练样本挑选方法进行改进工作,提出了几种基于K均值聚类算法的训练样本挑选方案,并且通过实际测试验证了这些方案对于提高整个系统的性能的有效性;根据系统的需要,该文详细叙述了金融票据OCR系统模板定义工具的创建过程.
其他文献
智能测试系统是计算机技术与自动测试技术相结合的产物。与计算机技术的结合成为测试和仪器发展的主潮流。随着无线电电子学的发展及其在各方面的应用日益广泛,对电子测量技术和电子仪器系统提出愈来愈高的要求,在大规模集成电路的研制和生产中,使用智能电子测试系统实现人工测试无法解决的工作。智能测试系统正沿着计算机化、标准化和网络化趋势发展。 本课题来源是国家211工程重点实验室建设。本文首先讨论了电子测量
票据自动处理系统是一个基于切分的识别系统.该文重点讨论了手写数字串的切分过程,这里用到的切分方法是基于字符本身特征的,而不依赖于识别技术.切分系统包括预处理、初步切
板-球系统是典型的非线性系统,是球-杆系统的二维扩展,是一个多变量非线性的双输入双输出控制系统。其控制对象是具有两个相互垂直的旋转轴的平面板,控制目标是让一个自由滚动的
随着计算机技术、通讯技术、网络技术的快速发展,家庭网络正逐步进入人们的日常生活。本文在简单介绍家庭网络技术发展状况的基础上,论述了X-10协议和CEBus协议的关键技术,然后
该文以本钢焦化厂的1#和2#焦炉集散控制系统的开发为背景,探讨如何采用相适应的自动控制方法来保证焦炉生产过程的稳定、保证焦炭质量和节约能耗,以实现焦化厂生产过程的持续和
该文从作者实际参与的梧州工商银行个人金融管理信息系统项目出发,引入了CORBA与Agent技术,介绍了基于CORBA的Agent通信机制,在此基础上提出了解决以上问题的方法,并给出了银
预测控制的理论研究,包括设计参数与闭环性能之间的关系、稳定性、鲁棒性以及有约束情况的处理等问题,这些都是当前这一领域研究的难点.该文针对预测控制中的若干理论问题展
pH中和过程是典型的非线性过程,而且经常包含大滞后环节,因此对该过程的辨识与控制是控制领域中的难题之一,如何处理系统的非线性问题和大滞后问题是解决该问题的关键。本文利用人工神经网络对这一问题进行了研究,特别是将通用学习网络(Universal Learning Network,ULN)首次应用于这一领域,初步提出了基于通用学习网络的辨识和控制方法。 通用学习网络是一种新型的神经网络。网络中的
如果将机器人看作是一种能够扩展人类工作能力的有效工具,那么人类在认识和改造世界的过程中就不能没有机器人。移动机器人是机器人家族中的一个重要分支,也是进一步扩展机器人
主要工作概括为以下几个方面:1.提出了面向问题的特殊专家-WWW和广义专家群体的概念.2.在综合集成研讨厅体系中,广义专家群体关于开放复杂问题的动态互过程,导致了整体层次上充满相