论文部分内容阅读
字符识别技术自20世纪六十年代提出以来,经过几十年的研究和发展,已广泛应用于数据统计、智能交通、金融税务等领域。然而由于字符本身种类多,字形复杂,且手写字符书写风格因人而异等问题,手写字符识别的研究仍是当前的一大难点。卷积神经网具有更仿生的层次化工作机理,能够自动挖掘训练数据内部的潜在规律,很好的避免了预处理和特征抽取等复杂的过程,因此在字符识别领域具有天然优势。本文调研和分析了国内外关于字符识别方面主流的文献和算法,着重基于卷积神经网的识别算法,在现有的卷积神经网字符识别算法基础上,提出了两种新的卷积神经网字符识别模型,在字符识别尤其是汉字识别上取得了良好的识别效果。本文的主要内容有:1.通过实验对LeNet-5卷积神经网模型性能进行分析,探讨卷积神经网的滤波器数目和尺度、池化方式、激活函数、正则化方式等参数对模型性能的影响,为构建卷积神经网模型实现模型参数和结构最优化提供方向和指导,实验基于手写数字数据集MNIST进行。2.本文在卷积层和池化层分别提出了一种多级特征提取模块,在卷积神经网的卷积层、池化层、浅层和深层分别使用多级特征提取模块替换原有模型中的特征提取结构,实验证明采取多级特征提取模块的模型其识别效果优于一般的卷积神经网。此外,本文提取出单级和多级特征模块的输出特征图,进行可视化对比分析,并对特征图进行比较,最后在离线手写汉字数据集CASIA-HWDB1.1上进行实验。3.把卷积神经网作为特殊的特征提取器,提取出CNN特征,同时分别提取出传统的Gabor特征和Gradient特征,将Gabor特征、Gradient特征和CNN特征进行多特征融合,再与传统的分类器SVM支持向量机相结合进行训练分类。本文提出的这种“CNN特征+Gabor特征+Gradient特征+SVM分类器”的识别算法在识别难例手写相似汉字数据集上取得了良好的效果,识别性能优于普通的CNN模型和传统的分类器。