论文部分内容阅读
中国书法是祖国灿烂文化的瑰宝之一。随着科技的发展与生活质量的提高,国家对文化事业的投入以及大众对文艺的追求呈现出不断提升的趋势,越来越多的字画真迹被收藏归档,并且制作成电子文件供爱好者参阅。书法字体存在诸多风格迥异的类属,通常初学者会针对某一种特定的风格进行临摹学习,但初学者对特定字体无法准确判断其类别,因此,借助计算机来辅助人工对收集的书法样本做正确分类具有重要的现实意义。然而,计算机在自动识别书法字体风格技术上尚不完善,传统的机器学习方法可以对样本分类,但前提是需要先通过特征提取算法对样本进行特征提取,由于人为定义书法字体样本的特征,所以提取的特征存在一定程度的主观性,分类结果受特征向量的影响,导致误分类率较高。机器学习方法无法自动提取图像特征,而且对所提取的特征只能做简单的分类处理,本文在卷积神经网络(Convolutional Neural Network,CNN)的框架下,对采样过程中的最大下采样(Max Pooling)和平均下采样(Avg Pooling)两种方法进行归纳分析,提出区域像素概率归一化下采样法(Local Pixel Probability Normalization Pooling,LPN Pooling)。LPN法结合了Max法的大值决策原则以及Avg法的平均分配原则,该方法首先计算采样区域内所有像素值的总和,然后分别计算各个像素点在该采样区域所占的权重,该权重作为各像素点参与采样的贡献度,将各权重值乘以其对应的像素值,最后对全部乘积做累加求和,即可得到LPN法的采样结果。为验证LPN方法,本文设计结构如下:首先,针对书法数据集的特殊性,需要确定出最佳下采样核规格。由于CIFAR-10数据集适用于多分类问题的研究,覆盖更多的像素分布范围,相比二值化数据集更适用于实验验证。自定义设计网络结构,将三种下采样算法嵌入神经网络中,最后经过设定不同规格的采样进行实验对比,得出采样核为3×3时,三种网络都取得最佳分类结果。其次,依据训练准确率与测试准确率的综合性能来评价各网络的性能,从实验中可以得出LPN方法的训练性能与测试性能差距最小,表明LPN网络具有最佳的综合性能,因此,选定LPN网络为最优网络模型。最后,通过LPN网络与多种机器学习分类方法对书法数据集进行实验,从实验结果中可以很明向得出,刚性划分误分率最高,模糊分类较好,BP神经网络有更大的提升,最高的分类准确率是由卷积神经网络取得。由理论验证与实验结果表明:LPN采样结果介于Max采样法与Avg采样法之间,证实了LPN法以概率大小将全部像素参与决策的原则为工作原理,该下采样法可以取得更加平缓、均衡的特征提取效果,由于特征图像充足且客观,因此在平均分类准确率优于Max与Avg采样方法。同时,验证了LPN卷积神经网络因其自提取与自学习的能力而比传统的分类算法具有更高的识别准确率。