论文部分内容阅读
卷积神经网络是一种局部连接的前馈式神经网络。典型的CNN常由卷积层、池化层和全连接层级联构成。卷积层通过卷积操作实现特征的逐层提取;池化层对各层特征进行降维;全连接层在输入和目标信息之间建立映射。通过良好的训练,卷积神经网络可以对海量图像数据进行分类,且性能优异。近年来,深度学习领域备受关注,卷积神经网络的理论和应用得到了不断的发展。传统CNN对于图像的扭曲、旋转、缩放具备一定的鲁棒性,但是这种鲁棒性较低,当测试图像与训练数据集在特征尺寸或尺度上存在较大差别时,CNN仍然可能会出现尺寸失配现象,模型的图像分类准确率不高。目前,国内外研究学者已经提出了一些改进模型以增强CNN多尺寸、多尺度处理能力。本文在相关研究的基础上,进一步提出了基于高斯尺度空间的卷积神经网络(GSS-CNN)模型。GSS-CNN的基本设计思想是,改变传统神经网络每次只能输入一张单尺度、单尺寸图像的特点,设计一个能够同时输入多张图像的多通道卷积神经网络。同时输入网络的多张图像符合图像金字塔的形式,即这些图像具有不同的尺寸,且尺寸越小,对应的平滑因子越大。本文的设计可以使卷积神经网络同时从多个尺度和多个尺寸提取图像特征,增强了卷积神经网络的适应能力。本文设计了GSS-CNNII、GSS-CNNⅢ、GSS-CNNIV三个GSS-CNN模型,并对其性能进行了测试。实验证明,在合理选择通道数的情况下,高斯尺度空间卷积神经网络具有比传统单通道卷积神经网络更优的图像分能性能,其中GSS-CNNⅢ的图像分类准确率相比传统单通道卷积神经网络提升了2.276%。同时,高斯尺度卷积神经网络拥有比传统卷积神经网络更高的尺度变化耐受度。在各尺度测试图像下,高斯尺度空间卷积神经网络均具备比传统卷积神经网络更高的图像分类准确率。另外,本文还针对高斯尺度空间卷积神经网络的通道数进行了探究,实验证明,三通道GSS-CNN的图像分类性能和尺度变化耐受度最高。为了进一步改进高斯尺度空间卷积神经网络,本文借鉴了集成学习中的Stacking集成策略,提出了基于Stacking集成策略的高斯尺度空间卷积神经网络(Stacking GSS-CNN)模型。该模型对GSS-CNN的拓扑结构进行了进一步的演化和改进,使得模型考虑了各个通道的权重,获得了比GSS-CNN更高的图像分类准确率。相关实验证明,在GSS-CNNⅢ模型与MLR次学习器结合的条件下,StackingGSS-CNNⅢ在经过尺度变化的MNIST数据集上获得了92.16%的平均分类准确率,比GSS-CNNⅢ高出1.26%,性能更优。