论文部分内容阅读
在人工智能和机器学习领域,特征提取一直是实现人机交互的主要技术之一,人脸表情识别研究作为人脸识别研究领域的一个分支,其特征提取和分类技术也成为研究的热点问题。人脸表情的研究在一定程度上依赖于对人脸识别技术的研究,但在某种程度上,人脸表情的研究也会促进人脸识别技术的研究。虽然目前人脸表情识别已经取得了一定的进步,但是依然有很多问题需要解决,光照、遮挡、姿态等影响因素给人脸表情识别带来了一定的难度,成为了目前人脸表情研究的重点和难点问题。笑脸表情是人脸表情中最重要的一种表情,也是最常见的一种表情。随着模式识别技术的发展、人们生活水平的不断提高以及电子消费产品的普及,笑脸识别技术越来越受到人们的重视。传统的笑脸识别方法主要集中在对限制条件下的笑脸进行识别,实验通常采用一些具有严格条件限制的公用库,虽然在实验库上进行实验能取得较高的识别率,但当应用于真实场景时,其识别性能急剧下降,所以如何提高笑脸识别方法的鲁棒性,使笑脸识别技术能克服光照、遮挡、姿态等影响因素,达到实用的目的是目前亟待解决的问题。为提高真实环境下笑脸识别方法的有效性和鲁棒性,本文主要针对非限制真实环境中的笑脸图像进行分类识别,基于深度学习理论进行了笑脸表情识别的研究,建立了深度学习网络模型,同时也研究了基于Gabor融合特征与深度网络模型的笑脸识别的有效性问题。本论文的主要内容如下:1.研究了多种自动编码器。自动编码器从广义上来说是一个三层的神经网络,通过不断反向微调调整输入与输出之间的误差从而达到在输出端重构原始输入的目的。从狭义上说,自动编码器也是一种特殊的受限玻尔兹曼机。本文研究的自动编码器是从广义上理解的,研究了多种自动编码器变体,分别介绍了每一种自动编码器变体。2.研究了基于深度自动编码器的笑脸识别方法。已知的深度网络模型大多由某一基础模型简单堆叠而成。为研究不同基础模型堆叠形成的深度网络对于笑脸识别的可行性和有效性问题,本文采用了压缩自动编码器和去噪压缩自动编码器两种不同的自动编码器模型堆叠的深度网络模型对笑脸进行识别分类。实验结果表明,该深度模型识别笑脸的方法是可行的,并且该方法优于分别由压缩自动编码器和去噪压缩自动编码器堆叠形成的深度网络。3.研究了基于Gabor融合特征与深度自动编码器的笑脸识别。本文论述了Gabor特征的两种融合方法,说明了利用Gabor融合特征作为深度自动编码器输入时网络的实现步骤,研究了两种Gabor融合特征与深度自动编码器模型结合实现笑脸分类的有效性,比较了将Gabor融合特征和原始图像数据作为深度自动编码器输入时笑脸识别的性能。实验结果表明,利用深度自动编码器学习表情多方向Gabor融合特征比学习像素级表情图像所耗费的时间更短,速度更快,同时,融合特征在某种程度上更有利于非限制真实环境下的表情图像识别。