论文部分内容阅读
深度学习的概念自2006年被提出以来,在众多领域都体现出了其强大能力。卷积神经网络作为一种典型的深度学习模型而备受关注。卷积神经网络在计算机视觉领域上的效果已经全面超越了传统的机器学习算法,例如目标检测,场景分类,物体识别,人脸识别等等。随着卷积神经网络在越来越多的问题中的使用,如何在实际应用中改进网络的性能变得尤为重要。本文总结了卷积神经网络的基本模型,和训练卷积神经网络的一般步骤,并针对于训练网络的每一个步骤介绍了现有的针对性修改的方法。总结了主要影响网络最终性能的因素,并在原有改进的基础上提出了本文的工作。不同于单纯地对网络结构进行修改和改进。本文针对图像分类问题提出了几种指导性的对网络性能改进的方法。本文的主要改进可以总结如下:1.本文提出了一种新的卷积核,命名为复杂卷积核。复杂卷积核会在图像中目标特征发生变换的时候对应地进行变换。相比于传统的卷积核,复杂卷积核能够有效地提取出带有不同形变的对应特征。2.基于受限玻尔兹曼机的降噪约束工作在网络的预训练阶段,能够使得网络学习到特征的分布更加具有规律性。3.基于基础网络预训练的特征集成学习框架,能够利用集成学习的优势,在不修改网络结构的情况下提高网络表现出的性能。本文所提出的改进更具有一般性,能够更加具体的指导如何改进网络的性能。本文也通过对比实验验证了策略的有效性,并且针对不同的应用场景给出了具体的改进方案。