论文部分内容阅读
Devijver和Kittler将特征提取定义为:“从原始数据中提取可以用于分类的相关信息,使得新的模式表达可以减少类内的差异,同时增大类间的差异。”它是手写体数字识别系统中的一个非常重要的环节,直接影响系统的识别率。而神经网络有较强的自组织学习、容错性、鲁棒性以及非线性处理等能力,被广泛应用于模式识别中。本文在此基础上进行了字符的特征提取和神经网络在手写体数字识别中的应用研究,实验结果表明,该方法取得了较好的识别率和可靠性,对孟加拉手写体数字有识别可靠性高的特点,满足了系统的要求,并且具有一定的理论意义和实践价值。本论文主要研究了字符的统计特征和结构特征在孟加拉文手写体数字识别的特征提取和字符分类两方面的应用。主要完成了以下几方面的工作:1、基于孟加拉手写体字符的实际情况,实现了包括图像平滑、二值化、笔划宽度归一化以及字符大小归一化等预处理工作;2、在字符统计特征研究的基础上,提取了手写体数字的方向特征,该特征具有良好的抗噪性能但具有一定的局限性,粗网格特征对噪声具有较强的抗干扰能力,本文采用了两种特征相混合的方法并采用BP神经网络进行识别;3、根据孟加拉手写体数字的特殊结构,又提出了一种开环-闭环的结构特征即空洞-圆孔特征,使提取的结构特征既能充分代表每类样本信息又能很好地将不同类别加以区分,有效的降低了特征的维数提高了分类器的效率;4、在字符分类方面,采用多级分类器作为孟加拉文手写体数字识别系统的分类器,并描述了相应的算法和程序设计步骤,实验结果证明识别系统达到了较高的识别率。