论文部分内容阅读
深度学习在面部活体检测领域已取得了较为显著的成果,然而在处理遮挡、光照、角度不当、AI换脸等复杂条件下的面部图片时,因难以预测数目较多的面部特征点集合,使得活体检测的准确率较差。为了提升活体检测的准确性,在现有解决方案中主要分为基于回归模型的方法与深度学习的方法。总体来讲,深度学习的理论基础源自于基于回归模型的方法,但是基于深度学习的方法做出了巨大的改进优化——深度学习以机器学习的方式代替了人为构建向量模型的复杂过程,并取得了更好的预测效果。然而深度学习在实际应用中,因受到各种干扰因素的影响,会出现活体检测准确率较差的问题。因此,本文对这些基于回归模型的方法与基于深度学习的神经网络模型展开研究,针对几种基于深度学习的网络模型做出改进,设计出了一种基于VGG-Res Net双层神经网络模型,用以提升活体检测的准确率。论文主要贡献如下:(1)为了提高面部特征点定位在有干扰因素影响下的准确率,本文在第一层设计了一种基于C-Canny算法与改进VGG相结合的网络模型。这一层网络用以实现人脸对齐与面部特征点定位功能,具体流程如下:首先,在人脸对齐阶段,通过C-Canny算法进行面部区域重定位,得到更为准确的面部区域。然后,将重定位后的面部图像输入本文改进的VGG网络模型,进行面部特征点定位。最终,将定位面部特征点结果输入到本文设计的第二层活体检测网络模型,用以实现人脸相似度分析、面部表情频次统计的功能。(2)为了提升活体检测的准确率,本文在第二层设计了一种用以处理面部视频流文件的活体检测网络模型。这一层网络结合Res Net-34网络模型、背景图像主成分析(PCA)和改进眼部比例因子算法(EAR)进行面部特征提取。最终,以基于逻辑回归的方式实现活体检测功能。具体流程如下:首先,将第一层神经网络得到的面部特征点集合输入到Res Net-34神经网络进行面部相似度对比,实现身份验证的功能。然后,将这些特征点集合进行EAR比例因子计算,分别记录眨眼频次、开闭口频次。并将输入的原图像进行PCA背景图像分析,通过正、负样本间的向量距离差值选取出最优阈值,实现对于面部图像的真伪性判断。最终,将上述得到面部特征信息作为活体判定层的输入参数,以基于逻辑回归的方式进行活体检测。(3)为了提升电力用户在高峰检测期间的成功率,本文设计的双层活体检测网络还在工程实践中完成了应用部署,检测流程概括如下:首先,第一层特征点定位模型获得基于canvas标签下的面部图像,实现人脸对齐与面部特征点定位的功能。之后,将定位的结果与原图像输入到第二层网络模型中,进行一系列的面部信息提取,用以实现最终的活体检测功能。综上所述,本文对现有的一些网络模型展开了大量的研究,对其不足提出了新的解决方案。经实验证明,本文设计的网络模型能够较好的定位复杂条件下的面部特征点,在处理面部视频流文件时,具有较高的活体检测准确率。并在ibug网站提供的300-v和300-vw开源数据集上,与一些现有的神经网络相比,在面部特征点定位方面将损失函数值降低约20%。本文设计的网络模型还在工程实践中得到了很好的应用,取得了非常好的效果。在活体检测准确率方面,达到了较高的正样本率。