论文部分内容阅读
近年来,随着互联网技术的飞速发展,网络上的信息不仅数量呈指数型上涨,形式也变得更加多种多样。伴随着这些信息对我们自身的影响,对信息提取的需求也开始不断增加。但由于网络信息复杂且数量庞大,仅仅依靠人脑去一一辨别这些信息已经变得越来越不现实。那么如何利用计算机代替人脑去识别、筛选并提取有用信息成为了互联网研究的一大热门领域。基于神经网络结构,利用仿生学原理的深度学习应运而生。随着文字搜索引擎的开发,对于图像的识别和搜索成为了下一发展方向,怎么样提高图像识别的速度和图像识别率将关系到图像识别的实用性和安全性,意义重大。相对于浅层网络,深度学习的多层网络结构,能够学习到更深层次的特征表示,能够用更简明的方式表达复杂函数。本文将深度学习中的几种多层神经网络结构运用到图像识别中来,可以有效的提高图像识别准确率,具体工作内容如下:(1)介绍多层感知机(MLP,Multilayer Perceptron)的基本原理,介绍多层感知机的简单结构,通过简单的感知机模型总结出来Sigmoid函数和Tanh函数的函数图像,以及通过分析多层感知机模型中的输出层所运用的回归方式,总结出逻辑回归的代价函数。在实验中使用批量随机梯度下降法(MSGD,Minibatch Stochastic Gradient Descent),使对应参数得到了最优化。(2)介绍深信度网络(Deep Belief Networks)的原理,分析深信度网络构建出的模型。通过预训练后,得到在DBN网络中只对权值空间进行局部搜索,收敛速度加快从而使得训练时间要大幅度减少的优化效果。(3)并在Theano库上采用Mnist手写数字集进行实验,通过对多层感知机、玻尔兹曼机、卷积神经网络训练三种算法之间的相互对比,得出在对于手写数字的图像识别上,传统卷积神经网络的图像识别率最高,达到了98.91%以上。因此,在手写数字时,采用传统卷积神经网络最佳的结论。(4)介绍传统卷积神经网络(CNN,Convolutional Neural Network)的传统卷积神经网络的发展过程,传统卷积神经网络的结构以及计算求解,训练过程。另一方面拟对卷积神经网络进行改进,引入主成分分析(PCA)数据降维预处理的方法,更换分类器,将改进后的卷积神经网络运用在olivettifaces人脸识别数据集,效果良好。(5)介绍受限玻尔兹曼机(Restricted Boltzmann Machine)的基本原理,并分析受限玻尔兹曼机的可视层与隐藏层的求解过程,得出受限玻尔兹曼机(RBM)相对于只有一层隐含层的多层感知机(MLP)网络模型由两大优点。另一方面,拟对玻尔兹曼机算法进行改进,引入交替迭代一种不断用变量的旧值递推新值的方法,进行对改进后的受限玻尔兹曼机重新训练,将改进后的受限玻尔兹曼机算法运用在olivettifaces人脸识别数据集上,进行图像识别,效果良好。