论文部分内容阅读
由于深度学习的不断进步,极大的提升了各种计算机视觉技术的性能,人脸识别作为计算机视觉技术之一迅速发展,在军事、金融、电商、安全防务等领域有着广阔的应用前景。人脸识别早期的研究是基于手工设计的特征,这种设计比较困难,需要很强的先验知识,很难设计出有效的人脸特征,卷积神经网络作为深度学习算法之一,有着天然的自动提取特征的能力,已成为人脸识别的主流方向。但由于人脸是非刚性的,不同于其它图像识别,受光照、遮挡、姿势等变化的影响较大。如何设置合理的卷积神经网络结构、损失函数等问题,来提取更有效的特征用于人脸识别成为本文研究的重点,本文研究的内容如下:(1)回顾了深度学习的研究历程,对人脸识别的发展现状进行了简介;详细介绍了卷积神经网络理论中的各层,重点分析了反向传播算法、残差网络和Softmax损失函数,并作了具体的理论分析,为进一步研究后文提供了理论基础。(2)针对角度Softmax损失存在强约束的问题,提出一种角度的三元损失对角度Softmax损失预训练模型进行微调的算法。算法首先对原来的卷积神经网络结构进行改进,将1X1卷积核与池化层加在不同残差块间,以进行选择更有效的特征;然后用角度的三元组损失对预训练模型进行微调,以降低困难样本的强约束条件;最后在测试时,分别提取原始人脸图像特征和水平翻转的人脸图像特征,对两个特征相加作为最终的人脸特征表达,以丰富人脸特征信息,提升人脸识别性能。实验结果表明,在大规模人脸身份识别中,本文提出的算法在仅用单模型和比较小的训练集就能够提高人脸识别率。(3)针对Softmax损失对特征只有可分性的不足,提出一种基于深度卷积神经网络的判别性人脸识别算法。该算法首先根据Softmax损失特征分布,在特征和权重向量间施加一个类内余弦相似性损失,使得类内更加紧凑,类间尽可能分离;然后在Softmax损失基础上通过归一化特征来更好的模拟低质量人脸图像,并通过归一化权重来减轻类别不平衡,使得与测试时的余弦相似性度量一致;最后联合归一化的Softmax损失和类内余弦相似性损失在预训练模型上进行微调。实验结果表明,该算法提升了特征的判别性,增强了模型的泛化能力,提高了识别率。