基于统计模型的面部特征点定位研究

来源 :中国科学院研究生院 中国科学院大学 | 被引量 : 0次 | 上传用户:bohecha_j
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
面部特征点定位是指在输入人脸图像上自动检测面部关键特征(如眼睛中心点,眼角点,嘴角点等)的技术,可以用于对齐待匹配的人脸图像,因而是全自动人脸识别中的关键步骤之一。此外,精确的面部特征点定位也是实现人脸合成、人脸驱动卡通、人脸跟踪、人脸姿态分析以及人脸表情分析等众多视觉任务的重要步骤。   本文调研面部特征点定位的国内外的研究现状,尤其详细介绍了基于点分布模型(PDM)的主动形状模型(ASM)方法,并对ASM的模型建立以及迭代搜索调整进行了深入的分析和讨论。发现面部特征点定位的难点主要在于人脸变化的多样性以及图像采集环境的复杂性。具体在ASM中,前者主要表现为主成分分析(PCA)模型不足以描述姿态、表情导致的面部形状显著变化,而后者则主要表现为光照、噪声和部分遮挡等导致的低层图像信息的不确定性问题。针对前者,本文分别首先采用了混合概率主成分分析(MPPCA)方法替换传统PCA模型的方法,并进一步提出了基于约束回归的方法。针对后者,本文采用了前端搜索时生成多候选点的方法。另外,为了尽量避免ASM迭代优化调整陷入局部极小,我们采用了更加精确的形状初始化方法和预先进行眼嘴状态估计的方案。   具体的,本文的主要研究成果如下:   (1)针对ASM定位结果严重依赖初始形状的问题,提出了利用少量关键点(如眼睛中心、鼻尖、嘴角等)设置更精确初始形状的方法。本文介绍了利用少数关键点和主成分分析(PCA)模型计算相似变换系数以及PCA投影参数的方法,并以此设置初始形状,实验证明了该方法的有效性。同时,针对表情变化问题,本文设计了一种利用眼嘴状态估计增强ASM的方法。该方法通过支持向量分类法(SVC)预测眼睛状态;而通过支持向量回归(SVR)来估计嘴巴的张开程度。由此得到的眼睛和嘴巴的状态,不仅可用于更优的初始形状设置,还可以用于指导、修正前端的局部纹理搜索,以提升定位效果。   (2)研究并实现了基于混合概率主成分分析(MPPCA)改进ASM的面部特征点定位方法,以更好地处理表情、遮挡以及复杂背景变化。该方法的鲁棒性得益于一个形状正则化模型(Shape Regularization Model),该模型整合了非线性形状先验即MPPCA、相似几何变换以及多个候选特征点的似然,是一个基于贝叶斯原理的三层产生式模型。该方法利用期望最大化算法(EM)迭代的检验最优候选位置并更新形状与姿态参数,从而达到鲁棒精确定位特征点的目的。由于混合高斯可以建模非线性形变,我们将其应用于多姿态面部特征点定位,并进行了一系列的评估实验。   (3)提出了利用约束回归方法代替PCA的ASM改进方法。主成分分析作为传统ASM方法的核心,它能很好揭示事物的本质,但同时也有很多缺点:模型难解释,载荷因子均为非零;严格的模型假设,数据只有在符合高斯假设的情况下才具有最优性能;全局线性,不能描述非线性变化;子空间的投影变换容易丢失细节信息等。为此,本文提出采用回归策略代替PCA,并考察了施加不同的约束对定位性能的影响,实验结果表明,回归策略比PCA具有更优的性能。
其他文献
随着集成电路制造工艺的发展,工艺偏差、时延缺陷、串扰效应以及电源噪声等将对芯片的定时产生更加严重的影响,并可能导致芯片的时延故障。为了确保芯片工作的可靠性,非常有必要
加权概念格是针对属性的重要程度,通过引入内涵权值而形成的一种格结构,并通过引入虚结点概念,保证了格结构的完备性。本文,对加权概念格的渐进式构造以及分类规则提取进行了
自动人脸识别技术经过几十年的发展,在可控条件下已经可以达到比较理想的性能。然而,在环境变化剧烈的情况下,人脸识别的性能会急剧下降。现有的人脸识别方法通常是基于较低分辨
现有的计算智能算法主要模拟了物理化学规律及动物的社会行为,对于植物的生长模式尚未给予足够重视。由于植物对环境的适应能力较强,生长速度较慢,因此,模拟植物的生长过程为
图形处理单元(Graphics Processing Unit,GPU)从问世以来便迅速发展,并很快成为计算机系统中不可或缺的重要组成部分。目前GPU已在低端嵌入式系统、个人桌面应用、图形工作站乃
随着虚拟化技术的不断发展,虚拟机软件扮演着基础平台的角色。KVM(Kernel-based Virtual Machine)是一种基于硬件的完全虚拟化的系统仿真器,自Linux2.6.20之后,它被集成在Linux
城市三维信息的获取对城市建设、开发规划、信息服务等方便起着重大作用,且可用于三维模式识别、3D动画设计等新兴领域。计算机立体视觉是被动式测距方法中最重要的距离感知技
超龙一号系统是国家智能计算机研究开发中心提出的一种以应用为导向的技术路线。其中的算法可重构加速卡基于FPGA实现,是整个系统的一个重要组成部分,关系到整个系统的效率。而
随着计算机、通信、网络、嵌入式等技术的发展,普适计算的硬件环境和软件环境正在发生巨大变化。这种变化使得普适计算的信息空间,与人们生活和工作的物理空间逐渐融为一体。在
随着企业信息系统中的数据量飞速增长,用于实现数据缩减的重复数据删除技术日益为人们所重视。重复数据删除技术主要应用于数据备份系统和数据归档系统。由于数据归档系统需要