论文部分内容阅读
近年来,由于脱机手写体汉字识别具有商业性和实用价值,该领域探索一直是模式识别应用研究的热点之一。但是,人工智能与自动识别毕竟还处于开创性阶段,许多概念和理论尚处于发展中。总体上看,脱机手写体汉字识别非常困难,迄今为止对脱机手写体汉字识别的定义、理论、方法等尚无统一的系统描述,还缺乏坚实的系统化的理论基础。但可以预见,随着系统理论、人工智能和计算机技术的发展,脱机手写体汉字识别理论方法必将出现更大的发展,并在实际中获得广泛的应用。本文主要工作如下:1.手写体汉字仿人识别机理分析及汉字基本笔段提取。分析了人类将汉字拆分为若干基本笔划复合连接交叉所形成的相对不变的拓扑结构来“认知”汉字的识字机理过程;定义了一种通过空间聚合和时间聚合构建过程神经元序列提取手写体汉字图像中基本笔段的方法,从根本上消除了手写体汉字畸变对笔段认知的影响。2.手写体汉字笔划获取及其相合相交类型判断。分析了人类识字时对笔划类型的容错性心理过程和拓扑结构辨识过程,归纳了具有冗余容错表征方式的六种汉字笔划合成类型;定义了汉字笔划的合成规则以及笔划相合相交类型判别规则,可仿人认知手写体汉字各容错笔划及其相合相交类型。3.多维特征知识数据结构表建立及仿人容错识别。模仿人类学习、记忆、对比与判断的识字过程,以汉字笔划在图像拓扑结构中的最佳覆盖为目标,定义了表征手写体汉字特征知识的多维数据结构表;先验建立了样本汉字的样本知识库,给出了手写体汉字的容错识别规则,可实现手写体汉字的仿人容错识别。4.实验与结果分析。选取SCUT-IRAC手写体汉字库中不同类型的100个手写体汉字图像,对文章研究的脱机手写体汉字仿人识别方法进行了实验验证。实验结果表明,该方法具有接近人类对手写体汉字笔划结构的认知能力和容错识别手写体汉字的准确性。该方法为提高冗余容错性,因此存在重码和误码现象。