论文部分内容阅读
作为生物特征识别的一个重要的分支,人脸识别逐渐成为了计算机视觉领域的一个热门研究课题,得到了越来越广泛的关注。众多的人脸识别方法被研究人员相继提出,其中,基于表观(Appearance-based)的人脸识别方法由于其简单、实用性强和有效性高等优点,成为了人脸识别的研究热点之一。该类算法通常包括两个重要的过程,即特征提取和分类。本文围绕非负矩阵分解(Non-negative MatrixFactorization,NMF)这种新的特征提取方法,和基于稀疏表示的分类器(SparseRepresentation based Classification, SRC)这种新的分类器展开的。NMF是一种新的特征提取方法。由于具有非负约束,NMF能够提取到训练样本的局部成份。并且,研究发现,人脑是通过事物的局部来感知外界事物的,因此,NMF和人脑感知事物是有联系的。所以,基于NMF的人脸识别方法具有很强的实用价值。近年来,由于其识别率高、鲁棒性强等优点,基于稀疏表示的人脸识别方法受到越来越多科研人员的关注。和传统的子空间学习算法不同,稀疏表示并不关心采用何种特征进行降维,却强调稀疏性和分类器的设计。稀疏表示的研究表明,如果分类器设计的适当的话,选择何种特征降维已经不重要了。因此,基于稀疏表示的人脸识别方法将人脸识别的研究重心引入到分类器设计上。围绕NMF和稀疏表示,本文的创新性成果和主要工作如下:(1)提出了基于光滑性和主成分的NMF (Smoothness and Principal ComponentsBased NMF, SPNMF)算法。通过对NMF的研究,发现NMF收敛慢的原因是基图像含有很多噪声。此外,NMF的系数矩阵相关性较大,不利于识别不同图像。鉴于现有NMF算法的缺点,本文提出了SPNMF算法。首先,将一个常数矩阵添加到基矩阵上,来增强基矩阵的光滑性,同时,平滑噪声点,最终减少NMF的迭代次数;其次,为了提高系数矩阵不同列之间的区分度,将系数矩阵不同列之间的方差增加到NMF的损失函数上,作为惩罚项。最后,在PIE、AR和FERET三个公用的人脸库上进行了大量的实验,结果表明,本文提出的SPNMF算法不但识别率高于NMF,而且速度比NMF快2至4倍,因此,SPNMF具有较强的实用价值。(2)提出了二维非负主成分分析(Two-Dimensional Non-negative PrincipalComponent Analysis,2DNPCA)算法。本文通过对二维主成分分析(Two-DimensionalPrincipal Component Analysis,2DPCA)的研究,发现2DPCA是基于整幅图像的算法,通过最大化特征协方差矩阵的迹来保护总体方差。但是,2DPCA不能提取对人脸识别非常重要的局部成份。受到基于局部特征的NMF算法的启迪,本文将非负约束融入到2DPCA中,提出了2DNPCA算法。2DNPCA是一种基于图像矩阵的方法,能够保持人脸图像的局部结构;并且2DNPCA具有非负限制,能够提取人脸图像的局部成份。因此,2DNPCA同时具备2DPCA和NMF的优点。此外,2DNPCA打破了最小化损失函数的框架,迭代过程中只需提取基矩阵而不用同时提取系数矩阵,使得2DNPCA的速度显著快于传统的基于NMF的算法。在Yale、FERET、AR和Extended Yale B四个标准人脸库上的实验结果表明,2DNPCA是一种非常有效且优于2DPCA、2DLDA、2DLPP和NMF的人脸识别方法。(3)提出了基于梯度的稀疏表示分类器(Gradient-based Sparse RepresentationClassification, GSRC)。近来,尽管基于l1范数和l2范数的稀疏表示对于正面人脸图像识别已经取得了很有前景的识别效果,但是,它们都需要完备的训练字典,这个条件现实中很难满足。本文主要关注如何设计稀疏表示算法来解决不完备训练字典问题。由于图像梯度能够明确地考虑相邻像素点之间的相互关系,而且和图像像素相比,图像梯度对光照变化更不敏感,所以本文将图像梯度融入到稀疏表示框架,提出了GSRC算法。通过将图像像素值和图像梯度相结合,和基于稀疏表示的分类器(SRC)相比,本文提出的GSRC算法具有更小的模型误差,对每个类别要求更少的训练样本。此外,GSRC可以很容易地与传统的特征提取算法结合,并且可以通过正则化最小二乘法求解,使得GSRC速度显著快于SRC。采用Yale、AR、Extended Yale B和CMU PIE四个公用的人脸库进行实验,结果表明GSRC对于不完备训练字典问题和图像遮挡问题都是十分有效的,并且GSRC算法的速度在实际应用中是可以接受的。