论文部分内容阅读
情感在人类社会交往传递信息的过程中起到了非常重要的作用。人脸表情是人类表达情感状态和意图的最有力、最自然、最普遍的信号之一。建立一个自动识别人脸表情的系统是近年来的一个研究热点。目前深度神经网络越来越多地被用于学习识别表征的自动化人脸表情识别任务。由于自然环境下的复杂场景,导致在采集自然环境下的人脸表情数据集时存在很大的困难,现存的深度学习算法在自然环境下的数据集上由于缺乏足够的训练数据导致过度拟合。大量的训练数据才能驱动深度学习模型去捕捉与表情相关的细微变化。此外,在有限的训练样本的情况下,自然环境下的复杂环境因素,例如照明变化、遮挡、大幅度姿态变化等影响因素是导致情感识别率偏低的主要因素。针对以上两个问题,本文提出基于少样本学习和解散表达学习的自然环境下人脸表情识别方法。文章的主要内容和创新点如下:1)基于少样本学习的自然环境下人脸表情识别方法。该方法引入少样本学习的思想,构建一个自然环境下的FER深度学习框架—卷积关系网络(Convolutional Relation Network,CRN),该框架通过比较充足样本间的特征相似性进行学习,利用样本数量较少的样本来识别新的类。具体来说,该方法学习一个度量空间,在这个空间中,可以通过计算距离来进行分类,利用深度表达特征的强大鉴别能力来概括网络的预测能力。为了实现这一点,对特征进行约束,使不相同类的特征之间的距离最大化,并发现相同类的共性。在三个具有挑战性的自然环境的数据集(RAF-DB、FER2013和SFEW)上的大量实验表明,所提出的方法显著优于最先进的方法,平均识别率提高1.34%~7.75%。2)基于解散表达学习的自然环境下人脸表情识别方法。该方法引入解散约束的思想,学习自然环境下的人脸显著情感特征。通过编码器得到更高层次的特征,再通过高斯采样得到人脸相关的生成因子,最后从生成因子通过加权得到情感相关因子,提取情感显著特征,对情感进行分类。该方法通过从给定图像中解散出情感相关因子,减少非情感相关因子对识别任务的影响,降低自然环境下的复杂背景等因素对人脸表情识别的影响。实验结果表明:基于解散表达学习的自然环境下人脸表情识别方法在主流的自然环境的数据集上进一步提升情感分类性能,一定程度上能够做到容忍环境的变化。3)设计并实现自然环境下的人脸表情识别原型系统。本系统采用MATLAB、Python程序设计语言和深度学习的框架进行原型系统的设计和实现。该系统包含人脸检测、模型加载与情感识别等模块。其中,提出的基于少样本学习和解散表达学习的自然环境下人脸表情识别方法均在该原型系统中得以体现。通过原型系统的实现验证所提方法的有效性和实用性。