论文部分内容阅读
面部特征点定位是指在输入人脸图像上自动检测面部关键特征(如眼睛中心点,眼角点,嘴角点等)的技术,可以用于对齐待匹配的人脸图像,因而是全自动人脸识别中的关键步骤之一。此外,精确的面部特征点定位也是实现人脸合成、人脸驱动卡通、人脸跟踪、人脸姿态分析以及人脸表情分析等众多视觉任务的重要步骤。
本文调研面部特征点定位的国内外的研究现状,尤其详细介绍了基于点分布模型(PDM)的主动形状模型(ASM)方法,并对ASM的模型建立以及迭代搜索调整进行了深入的分析和讨论。发现面部特征点定位的难点主要在于人脸变化的多样性以及图像采集环境的复杂性。具体在ASM中,前者主要表现为主成分分析(PCA)模型不足以描述姿态、表情导致的面部形状显著变化,而后者则主要表现为光照、噪声和部分遮挡等导致的低层图像信息的不确定性问题。针对前者,本文分别首先采用了混合概率主成分分析(MPPCA)方法替换传统PCA模型的方法,并进一步提出了基于约束回归的方法。针对后者,本文采用了前端搜索时生成多候选点的方法。另外,为了尽量避免ASM迭代优化调整陷入局部极小,我们采用了更加精确的形状初始化方法和预先进行眼嘴状态估计的方案。
具体的,本文的主要研究成果如下:
(1)针对ASM定位结果严重依赖初始形状的问题,提出了利用少量关键点(如眼睛中心、鼻尖、嘴角等)设置更精确初始形状的方法。本文介绍了利用少数关键点和主成分分析(PCA)模型计算相似变换系数以及PCA投影参数的方法,并以此设置初始形状,实验证明了该方法的有效性。同时,针对表情变化问题,本文设计了一种利用眼嘴状态估计增强ASM的方法。该方法通过支持向量分类法(SVC)预测眼睛状态;而通过支持向量回归(SVR)来估计嘴巴的张开程度。由此得到的眼睛和嘴巴的状态,不仅可用于更优的初始形状设置,还可以用于指导、修正前端的局部纹理搜索,以提升定位效果。
(2)研究并实现了基于混合概率主成分分析(MPPCA)改进ASM的面部特征点定位方法,以更好地处理表情、遮挡以及复杂背景变化。该方法的鲁棒性得益于一个形状正则化模型(Shape Regularization Model),该模型整合了非线性形状先验即MPPCA、相似几何变换以及多个候选特征点的似然,是一个基于贝叶斯原理的三层产生式模型。该方法利用期望最大化算法(EM)迭代的检验最优候选位置并更新形状与姿态参数,从而达到鲁棒精确定位特征点的目的。由于混合高斯可以建模非线性形变,我们将其应用于多姿态面部特征点定位,并进行了一系列的评估实验。
(3)提出了利用约束回归方法代替PCA的ASM改进方法。主成分分析作为传统ASM方法的核心,它能很好揭示事物的本质,但同时也有很多缺点:模型难解释,载荷因子均为非零;严格的模型假设,数据只有在符合高斯假设的情况下才具有最优性能;全局线性,不能描述非线性变化;子空间的投影变换容易丢失细节信息等。为此,本文提出采用回归策略代替PCA,并考察了施加不同的约束对定位性能的影响,实验结果表明,回归策略比PCA具有更优的性能。