无约束手写数字串切分与识别算法研究

被引量 : 5次 | 上传用户:tvxq905
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
手写数字识别是光学识别技术OCR的一个分支,属于模式识别的一个重要问题,研究如何利用电子计算机自动辨认人手写在纸张等介质上的阿拉伯数字。这在邮政分拣、银行票据识别、报表统计等众多领域中有着广泛应用前景。同时,数字串切分是识别的关键步骤,其准确与否直接影响到后面识别率的高低,因此同样具有重要研究价值。本文主要讨论手写体数字串在脱机、无约束(即没有任何类似框格限制)的情况下对其进行切分和识别的算法。多年来,人们在这个研究领域提出了很多有效的方法,但因书写人的随意性,风格的迥异性使得该领域远不能达到完善的程度。尤其是在无约束造成大量重叠、粘连、断笔存在的情况下,其切分和识别率都达不到满意的效果,仍有许多工作要做。本文在前人研究成果的基础上,致力于无约束脱机手写数字串的切分和识别算法的研究,目的是为了能在该领域做些有益的探索。主要工作包括以下几个方面:(一)数字串切分:在列举了多种现有经典切分算法的基础上,提出一种新的基于数字串字符图像凹凸特性的切分方法。该方法从根本上克服了已有算法需要细化、路径搜索等复杂处理的弊端,从而大大提高切分率,缩短切分时间。(二)单数字识别:本文未采用目前广为流行的神经网络方法,而是提出一种利用字符图像的凹凸特性,构造其笔顺编码及正则表达式匹配的新方法。因利用字符的整体特征,故识别过程简单快速。在获得了较高识别率的同时,识别速度也较其它方法提高了近一倍。(三)数字识别扩展:除了数字,本文提出的基于凹凸特性的识别方法还可扩展到小类别字符集。为此,特别做了有关26个大写英文字母识别的实验,并详细描述了利用字母图像凹凸特性识别的完整方法。与其它方法相比,识别率和速度都得到了提高。(四)系统实验:使用MATLAB 7.0开发工具,以国际上通用的手写体数字图像数据库和自主采集的手写体数字图像库为实验对象,独立完成了一个基于凹凸特性的无约束手写数字串切分和识别的演示系统。同时还与部分其它相关算法作了比较。可以看出,本文方法取得了较好效果。
其他文献
<正> 1964年8月12日,某猪场早晨发现一头约60斤重的猪突然不吃食,呆立在猪圈内光线较暗的角落里。经临床检查:牙关紧闭,口流白沫;两耳翘起不动,四肢殭直,背弓起,腹部卷缩;步
期刊
目的:寻找山西省饮水型地方性砷中毒(Endemic Arsenic Poisoning)发生的可疑影响因素(influencing factor),探讨地方性砷中毒暴露生物学指标(biomarker of exposure)、效应生
在高等教育研究中,抽象性思维与问题导向性思维缺一不可。抽象性思维与问题导向性思维彼此既分殊又统合,二者经由关系调适耦合成高等教育研究的整体性思维。整体性思维是抽象
会计政策选择是实证会计理论研究的核心内容之一。自从契约理论引入到会计学中以来,国外学者对会计政策选择进行了大量的研究,其内容主要是围绕实证会计理论三大契约动因假设,即
我国的巡航导弹事业虽已有了较大的发展,但与国际先进水平相比差距仍较大,尤其是导弹的射击精度仍处于较低的水平。巡航导弹作为一种精确制导武器,制导技术很关键,因而本文从
随着互联网的出现,标志着一种新的语言文化的到来一视觉文化。视觉文化的定义和特点表明信息时代文化的一个显著特征是视觉艺术与信息技术的高度融合,也是网络时代视觉文化的表
车辆装备保障是部队装备保障工作的重要内容之一,是关系到部队能否开得动、打得赢的关键环节。本文以系统工程、军事运筹学、决策论等学科的原理为基础,通过运用计算机语言、人
人体检测与跟踪是视觉人体运动分析的重要组成部分,在视频会议、医疗诊断、高级人机交互、智能视频监控、虚拟现实以及基于内容的图像存储与检索等方面都具有广泛的应用前景和
蔗糖是众多植物的光合运转糖,多数植物器官从叶片中最先得到的光合产物就是蔗糖,因此,研究清楚蔗糖在植物各器官中的代谢、特别是研究清楚逆境条件下蔗糖在植物各器官中的代谢,对
姬松茸(Agaricus Blazei Murill)原产于北美南部、巴西和秘鲁等地,是1972年日本人工栽培获得成功后才得以开发的一种食药兼用的名贵真菌。姬松茸具有浓郁的杏仁香味,菌盖嫩,菌柄脆