论文部分内容阅读
手写体数字识别即利用计算机自动辨识出手写阿拉伯数字,属于机器视觉的研究范畴之一。考虑到阿拉伯数字的全球通用性以及手写体数字应用场合较多,手写体数字识别已经得到了许多专家学者的关注研究。但是由于不同地区不同人的书写习惯不同,导致手写体数字存在许多变体,增加了识别难度,手写体数字识别技术仍然是机器视觉中的一个重要研究方向。神经网络分类器由于对噪音数据有很高的承受能力已经得到了极其广泛的应用,但是传统神经网络由于训练时间长、易陷入局部最优等问题,训练出来的分类器效果不是很理想。极限学习机网络参数随机给定,训练过程不需要迭代调整,训练速度快不会陷入局部最优解,已经证明了其在模式识别方面的优越性,本文通过试验着重讨论该分类器的优缺点,针对极限学习机网络分类器的泛化性和稳定性方面的不足,提出了一种粒子群极限学习机网络,并通过试验比较了这两种网络的区别。手写体数字识别的关键技术主要包括特征提取和模式识别。本文针对这两方面主要做了如下工作:1.为了最大限度的获取图像有用信息,便于后期特征提取,本文对手写体数字图像进行了预处理:灰度化、二值化、膨胀腐蚀、校准与归一化处理。2.在综合研究了手写体数字网格特征和结构特征的基础上,本文提取了手写体数字的轮廓特征、傅里叶变换特征、hu不变矩特征、十三点网格特征、粗网格特征、投影特征等。考虑到原始特征维数过多,直接应用于分类器分类会造成分类器训练速度过慢、识别精度不高的问题,本文采用了一种特征降维方法-主成分分析法对原始特征进行降维处理。3.提出了一种粒子群极限学习机算法,利用上述特征建立了手写体数字识别分类器。通过在NIST数据库中测试并与传统分类器进行比较,证明该算法应用于手写体数字识别中具有较好的性能。4.利用MATLAB GUI建立了一套手写体数字识别系统,采集手写体数字图像并利用已经建立的分类器进行识别,进一步验证了本文算法的正确性,为手写体数字识别提供了指导意义。