论文部分内容阅读
人脸认证是当今模式识别与计算机视觉学术界和工业界的热门研究主题之一,在安防、金融、军事、交通、商务等领域均有广泛的应用前景。随着深度学习的飞速发展和数据量的日益提升,计算机的人脸识别能力在一定程度上已经超过了人类水平,目前正在向百万分之一甚至是亿分之一的误识率发展。在人脸认证模型的性能如此高的现在,如何能百尺竿头更进一步,更好地利用深度学习技术来进一步提升人脸认证模型的性能是如今的一大难题。损失函数是控制整个深度神经网络训练的中枢,本学位论文将深入探究深度学习中损失函数的机理,并把之前广泛用于通用图像识别的损失函数和多种用于度量学习的损失函数改造得更加适合人脸认证模型的训练。本学位论文的研究内容主要分为以下几点:1.在神经网络中进行L2超球面嵌入。在通用图像识别中最常用的Softmax交叉熵损失函数所优化的是内积相似度,而在人脸认证模型的测试过程中,使用的却是余弦相似度。为了使训练与测试过程保持一致,需要在训练过程中引入向量归一化的步骤。本文通过分析Softmax损失函数的性质,发现了Softmax对特征幅度的过度优化现象,从而论证了使用余弦相似性度量的必要性。然而直接将内积相似度简单地替换为余弦相似度会带来模型无法收敛至较小损失的问题,本文深入地分析了这一问题,提出了Softmax损失在归一化后的下界理论,从理论上解释了无法有效收敛问题的机理。该理论表明由于将特征嵌入到单位球时特征的模长固定为1,导致损失函数的下界过高而无法正常收敛。根据本文提出的理论,可以得到一个非常简单的解决方案,只需在计算完余弦相似度后乘以一个尺度系数s即可使损失函数能够优化至零损失。本文还分析了有关于s的一系列性质,这些分析将有助于对s进行设置。实验证明使用该解决方案对已有的人脸认证模型进行几轮微调即可得到可观的性能提升。2.提出对度量学习损失函数进行分类化改造的思路。在传统的度量学习方法引入深度学习时,因为数据量和计算量非常巨大,会存在采样困难的问题。在向量归一化的基础上,本文研究表明Softmax交叉熵损失函数中的权重矩阵实际上起到的是“类代理”的作用。本文通过将“类代理”的概念引入度量学习方法中,将样本与样本的比对替换为样本与向量的比对,即可规避采样带来的问题,而同时又保持了度量学习能够同时减小类内距离和增大类间距离的优势。通过分析深度神经网络中归一化操作的性质,本文还分析了特征向量归一化具备的难例挖掘功能,以及“类代理”归一化具备的缓解类不均衡问题的作用。使用改造后的度量学习损失函数进行人脸认证模型的训练,在多个数据集上都取得了比原损失函数更加优秀的性能。3.引入加性间隔以增大类间距离。在带有L2超球面嵌入的Softmax交叉熵损失函数的基础上,本文进一步分析了分类损失函数与度量学习损失函数之间的异同,并将两者的优势互补,将间隔的概念引入了Softmax交叉熵损失函数。本文通过实验发现在多种间隔的形式中,加性的间隔具备更好的性能,实现方式也较为简单,非常容易复现。为了充分认识加性间隔的特性,本文对加性间隔的性质进行了一系列的数学分析与可视化展示。对于人脸认证模型的性能评价,本文中提出了一种名为隐式间隔的评价指标,它能够在训练过程中就对模型的判别能力进行评价,从而指导训练过程中对模型参数的调整。在L2超平面嵌入的基础上引入加性间隔后,人脸认证模型的性能在多个大型数据集上取得了高达5%的性能提升,是目前最好的人脸认证损失函数之一。