论文部分内容阅读
人脸识别一直是学术界和工业界的研究热点。尽管在过去几十年内,研究人员提出了一系列的人脸识别方法。但是由于姿态、表情、光照等外部因素的干扰,这些方法始终不能取得很好的识别效果。卷积神经网络通过逐层地学习样本的特征,能够表示样本的复杂变化,因此在人脸识别领域取得了出色的成绩。在设计网络结构时,常见的卷积神经网络模型主要采用了传统的平均/最大池化层。然而这些池化层只计算了输入特征的一阶信息,比如平均值或最大值,这在一定程度上限制了模型的学习能力。另外,人脸不仅包含全局判别信息,还包含局部判别信息。单一的模型往往只挖掘了其中一部分的判别信息,因此其性能受限于这些判别信息的丢失。为了克服这些问题,本文分别提出基于二阶池化和超完备表示的深度学习人脸识别方法。第一种方法的核心组件是二阶池化卷积神经网络,通过改善传统的池化层,提高模型的学习能力。首先采用若干层的卷积层和池化层将原始的人脸图像变换为特征图。然后将该特征图分解成一组局部特征,并对其中每个局部特征进行外积运算,得到相应的结果矩阵。最后将运算的结果作为平均/最大池化层的输入,这使得传统的池化层能够挖掘输入特征的二阶统计信息,从而学习更加鲁棒的人脸表示。第二种方法的核心组件是多区域卷积神经网络,通过提取和融合不同图像区域的判别信息,使得最终的人脸表示更加完备和更加鲁棒。首先以一张完整的人脸图像和一组人脸区域作为输入,并利用共享层将这张人脸图像变换为特征图,其中共享层是由几个卷积层和池化层组成。然后对于每块人脸区域,区域提取层在该特征图上提取等价的区域特征图,并利用单独的分支网络去学习该区域的特征。最后通过提取和拼接这些区域的特征,得到给定人脸的超完备表示。相比于已有的方法,该模型通过共享低层次的隐藏层,具有更优的计算效率。本文提出的两种模型都在CASIA-Web Face库和LFW库上进行实验和分析,实验结果表明本文的模型能够学习更加有效的人脸表示,从而提高了识别精度。