论文部分内容阅读
视频人脸识别是图像处理和计算机视觉领域最具有挑战性的课题之一,应用的前景十分广泛。目前,这个领域的研究虽取得了不错的成果,但是在现实应用中仍存着很多障碍。尤其在进行视频人脸识别时,由于缺乏被检测人的主动配合,所检测到的人脸往往在观测角度、光照、大小、位置等方面存在较大差异,给识别工作带来更大的挑战。为此,本文开展了基于深度学习的视频人脸识别技术的研究工作,针对视频人脸识别过程所面临的各种问题,设计实现了高效的人脸检测、识别算法,并将超分辨率复原技术引入人脸的识别过程,进一步提高图像质量,改善识别效果;最后搭建了基于超分辨率复原的视频人脸识别系统,验证相关算法的可行性和有效性,收到了较好的效果。主要研究内容包括:设计实现了基于MTCNN视频人脸检测算法,并与传统基于Harr特征与AdaBoost的人脸检测算法进行了对比分析。针对视频人脸检测中姿势、光照、遮挡等问题,设计实现了一种基MTCNN(Multi-task Cascaded Convolutional Networks)深度学习网络的视频人脸检测算法,该算法利用检测和校准之间固有的相关性,在深度级联的多任务框架下提升检测性能;并进一步利用三层级联架构结合精心设计的卷神经网络算法,实现人脸检测和关键点的粗略定位。同时在对传统人脸检测技术进行深入学习和分析的基础上,实现了一种基于Harr特征与AdaBoost的人脸检测算法,用于与前述算法进行对比分析。实验结果表明,基于MTCNN深度学习网络的方法能够更好地提取视频中关于人脸的有效特征,实现更为准确的检测,其与传统基于AdaBoost和级联结构的方法相比,正检率有显著的提高。设计实现了一种基于多层优化LeNet模型的视频人脸识别算法。在视频人脸识别中,对于捕获到的人脸图像如何提高识别率是研究的重点之一。本文从视频人脸识别的特点和实际需求出发,设计实现了一种基于多层优化LeNet模型的视频人脸识别算法,以传统LeNet-5网络为基础,针对视频人脸的特征和识别的具体需求,对网络结构进行了多层优化,增加了一层卷积层和池化层,并对激活函数、参数更新规则、反向传播方法等环节进行了重新设计和超参数优化。同时在对传统人脸识别技术研究的基础上,实现了基于主成分分析法PCA(Principal Component Analysis)的特征脸这一经典传统人脸识别方法和基于传统的LeNet-5模型的人脸识别算法,用于与前述方法进行对比分析。经过多个数据集的测试结果表明,本章所设计算法获得了较高的识别率,尤其在LFW、ORL和MegaFace三个数据集中识别率分别达到了97.2%、97.1%和97.5%。设计实现了一种基于精简VGG(Visual Geometry Group)网络的人脸图像超分辨率复原算法,将其用于低质视频人脸的识别。针对视频人脸识别所面临的人脸图像成像条件差、分辨率低等问题,设计实现了一种基于精简VGG和反卷积的人脸图像超分辨率复原算法。通过对传统的VGG模型进行精简化设计,实现了高低分辨率图像间映射关系的建模,进而采用反卷积网络实现图像的超分辨率复原过程。采用公共数据集LFW和ORL对算法性能进行了测试,结果表明,该算法的超分辨率复原性能与深度学习超分辨率复原网络SRCNN(Super Resolution Using Conventional Neural Network)算法相比,具有显著的提升。进而将其用于低分辨率人脸的识别过程,实验结果显示,经过超分辨率复原的高分辨人脸图像比原始低分辨人脸图像的识别率从62.46%提升到了89.96%,足以证明本文提出的超分辨率复原算法对人脸识别效果的提升。设计并且开发了基于超分辨率复原的视频人脸识别原型系统。结合实际应用需求,对所提出的视频人脸检测技术、人脸图像超分辨率复原技术和人脸识别技术的可行性和有效性进行了验证测试。以世林DSP监控网络摄像机作为视频流输入,然后利用本文所实现的算法,对加载的视频流进行人脸检测,人脸识别和人脸图像超分辨率复原处理,最后显示识别结果。最后,通过两组不同角度的监控视频测试,该系统的各项功能达到了预期效果,证明了本系统的有效性。