论文部分内容阅读
人脸表情识别(FER)可以在许多领域得到应用,例如,虚拟现实、视频会议、广播和网络服务中的客户满意度研究、人机交互、机器人控制以及驾车状态检测等,具有非常重要的应用价值,日益成为研究的热点。在FER中,不同环境下捕捉到人脸表情图像相对于训练库中的图像可能存在着一定平面旋转。传统的FER系统解决该问题的方法是在图像预处理的过程中,对表情图像进行校正,使双眼处在同一水平线上,然后通过特征提取和分类,得到识别结果。本文针对该关键问题进行深入研究,提出另外一种解决方案,该方案在不降低识别效果的情况下,避开了图像预处理中的旋转角度校准步骤,提高了识别速度。本文的主要研究工作和创新点如下:1.对FER系统的理论及总体框架结构进行了阐述,同时也对最近的FER领域的研究做了部分总结;对FER的每一个步骤的算法进行了总结研究,重点研究了表情特征提取算法。2.提出一种新的基于极坐标傅里叶变换(PFT)的FER系统,该系统有两个特点:在预处理过程中不需要对图像进行校正;特征提取算法对旋转不敏感,能够将旋转问题转换成平移问题,然后借助于DFT消除平移的影响,从而提取到旋转不变特征。通过理论验证了该系统的两个特点,并在加拿大瑞尔森大学的RML数据库上进行了仿真实验,结果显示该系统具有良好的鲁棒性。3.构建了基于伪极傅里叶变换(PPFT)的FER系统。从理论上说明了PPFT的优势及取代PFT的意义,PPFT通过构造一种伪极网络来近似PFT,而且PPFT具有PFT所没有的快速算法,因此可以提高运算速度,同时PPFT可以通过横向插值和径向插值两步来逼近PFT,也就能够保证识别率。通过实验定量分析了识别率与图像旋转角度之间的关系,验证了该系统更有优势。