论文部分内容阅读
随着社会的发展,英语作为国际通用语言得到了日益广泛的应用,因此有大量的英文文档整理、查询、统计的工作需要完成,而英文文档识别系统可以轻而易举地完成很多以前难以想象的工作。一个完整的英文文档识别系统,包括文档切分、单词切分、单字母识别、单词识别、后处理等部分。其中单个字母的字符识别,是整个识别系统的核心。通常对英文文档的识别,都是基于单词。单词识别少数方法是以单词整体为识别对象,大部分是基于单字符识别,即先对单词进行切分,得到字符,然后再进行字符识别。手写英文字母识别系统主要分为三个主要部分,分别是图像预处理,特征提取和判断识别。本文主要考虑特征提取和判断识别部分,特征提取主要提取统计特征和结构特征,并把它们相互融合得到训练与识别所需特征;判断识别采用常用的人工神经网络的识别方法,本文根据手写体字母的特点选取了LVQ神经网络对其进行识别,并对其作进一步的改进。本文以一个26万左右的手写体字母图库作为研究对象,根据需要提取训练样本和测试样本。因为字母库中的图像还没有达到提取特征和输入识别的要求,所以要作适当的预处理。首先是字母图像大小不一,要进行归一化处理;其次是提取特征时需要图像的骨架和轮廓,要进行细化处理和轮廓跟踪。在细化和轮廓跟踪中本人对算法进行改进,使得字母图像在预处理后的效果更好,有助于提取更好的特征,提高识别率。在预处理完成后要提取特征,本文对原图像提取投影特征和粗网格特征,对骨架图像提取方向特征,最后对轮廓提取外围特征。其中方向特征和粗网格特征是局部描述的统计特征,投影特征是全局描述的统计特征,而外轮廓特征是一种结构分析特征。本文将这三种特征相融合输入神经网络进行训练和识别,在实验中达到了一个很好的效果。最后对神经网络进行训练识别。本文从字母库中随机抽取2600个字母图片作为训练样本,并抽取不同于训练样本的1040个作为测试样本。把训练样本和测试样本输入LVQ进行训练和识别,并与BP神经网络进行比较。实验证明,LVQ神经网络与BP网络相比,结构简单,只需要三层网络就可以实现模式识别;不需要将输入向量进行归一化、正交化,只需要直接计算输入向量与竞争层之间的距离,从而实现模式识别;且收敛速度比BP网络更快,不存在BP网络的有可能陷入局部最小问题;也就是说,LVQ神经网络不但简单易行,而且识别效率更高。因此,采用LVQ网络进行手写字母识别是合适的。