论文部分内容阅读
表情是人类表达情绪的一种基本方式,是人们正常交流的有效非语言手段,丰富的表情有助于人们更加准确理解交流双方的语言表达意思,因此研究人脸表情智能识别具有重要意义。本文通过查阅国内外表情识别相关资料,深入研究现有识别方法及相关理论,针对现有通用表情识别步骤,详细介绍从人脸检测一直到表情识别中涉及到的每一环节。通过人脸的混合模型实现多角度人脸有效检测,然后运用后验概率Snake模型实现人脸五官的准确定位并对表情识别有重要影响的部位进行分割,最后提取关键形变位置PHOG特征,并采用稀疏编码方式实现表情有效识别,且通过噪声和遮挡实验,证明其具有良好鲁棒性。 本文的主要工作: 1、本文针对实际情况中,采集到的人脸无法保证全部都是端正图像,而主要进行多角度人脸检测的研究。针对人脸的非刚性及复杂多变性,选用能够很好的描述目标边缘信息的HOG特征,运用LSVM分类器训练多角度人脸局部形变模型,为了更好的检测多角度人脸,构建包含正面人脸、半侧面人脸及正侧面人脸局部形变模型的人脸混合模型,实现多角度人脸的有效检测。 2、在人脸理解的深入研究中,几乎都需要在提取五官特征的基础上进行,这就需要对五官进行准确的定位分割。本文采用Snake模型匹配的方法进行正脸五官的定位研究,并对形变模型能量最小化过程运用概率分布求取最大后验概率进行改进,克服Snake模型对初始位置敏感的瑕疵,有效解决五官定位的鲁棒性,并且提高定位速度;并对表情变化中变化明显的形变区域进行分割,方便后续的表情识别。 3、本文主要针对静态表情的识别进行研究。采用稀疏编码的方式进行表情识别,其中稀疏编码是模拟人类神经元感知提出的方法,用ODL方法对提取到的关键区域的PHOG特征进行训练,获得表情字典,为稀疏编码识别做好准备。最后通过与PHOG+SVM方法共对噪声和遮挡表情进行仿真实验,对结果分析可以得知,本文方法可以有效识别人脸表情,且具有较优的鲁棒性。