论文部分内容阅读
随着科技产品的更新迭代,人机交互如何更加智能化成为一项很重要的课题,而情感是人类在进行交流时最直观的表现,所以在人机交互中,情感就变成了一种很重要的信息资源。通常情感计算的研究包含三个方面:面部表情的识别、语音的识别和人体行为姿势的识别。本文主要以表情识别为主要研究内容,对人物情感进行了分析。另外,随着多媒体设备的普及,网络视频数量的不断增长,通过人物情感进行视频分类,可以加强网络视频的管理并提升观众的用户体验。本文主要内容如下:1.图像预处理。对人脸进行情感特征提取首先需要锁定人脸区域,而收集到的样本数据由于背景、光线、图像尺度的影响存在着大量的图像噪声,同时人脸图像由于角度的旋转也可能不是规范的正面人脸。因此在表情识别前就需要对图像进行预处理,提取出相应的人脸区域。本文利用Adaboost算法进行人脸检测,使用双眼坐标位置进行倾斜校正,为后续的表情识别做好铺垫。2.特征提取。通过提取数据样本的几何特征和纹理特征对表情进行识别后,结合Gabor小波特征算子和均匀局部二值模式(ULBP)算子对图像进行纹理特征提取,使用主动形状模型(ASM)进行几何特征点定位,通过图像几何特征点间的距离,总结了度量表情几何特征点距离的关键特征点,提取相应人脸表情的几何特征。3.特征降维。Gabor小波在对纹理特征进行提取时,会导致特征维数高,内存空间消耗大,故本文采用稀疏法和主成分分析法(PCA)进行特征降维。通过数据集测试,对此方法的准确度进行了比较和分析。4.表情识别。表情识别是一个多分类问题,本文采用优化的基于二叉树实现多分类的支持向量机(RB-OVR-SVM)算法,构建相应的划分函数,对表情进行识别。5.视频分类。根据研究的表情识别方法对网上视频进行人脸检测和表情识别,绘制出相应的情感变化曲线,根据已有的心理学和概率学信息,归纳各类视频段的情感特征,对视频进行分类。在研究的过程中本文提出了以下创新点和改进:(1)对于人脸情感特征的提取使用了纹理特征和几何特征混合提取方法。(2)对于人脸情感特征的降维利用稀疏特征挑选方式,对特征进行挑选,在提高计算速度的同时,有效的保证了识别精度。(3)优化了基于二叉树多分类支持向量机算法,并成功用于表情识别。与之前支持向量机用于表情识别的多分类算法相比较,不仅仅提高了表情识别速度,同时解决了数据不可分的盲点问题。本文通过将纹理特征和筛选后的几何特征进行加权叠加,充分考虑到了图像的动态信息;同时利用RB-OVR-SVM算法,使表情分类准确率达到了94.4%。