论文部分内容阅读
人脸识别技术是模式识别和机器学习领域中的重要研究课题,一直为国际机器学习界所广泛关注。近年来,随着自动人脸识别系统在商业和安全等领域的广泛应用,人脸识别技术逐渐为人们所熟知。其主要研究问题可描述为:对于给定场景的静止或视频图像,如何利用已存储的人脸数据库确认场景中一个或多个人。特征抽取和分类器设计是人脸识别技术中的两个重要组成部分。如何提取更加有用的人脸特征及设计性能优良的分类器一直是人脸识别技术所追求的目标。本文对这两个方面问题深入的进行了研究和探讨,所提出的特征抽取方法和分类器算法在人脸识别方面得到了较成功的应用。主要研究工作和成果如下:1.针对线性鉴别分析(Linear Discriminant Analysis, LDA)对样本点局部结构特性欠考虑问题,提出一种改进的学习算法。该算法将流形学习算法的局部思想融入Fisher鉴别准则,从而在保持样本间局部结构特性的同时,提取出最佳的人脸鉴别特征。具体来讲,该算法首先利用样本间的近邻关系和类别标签信息将所有样本点分属于多个近邻类和非近邻类;然后,引入局部均值的思想,对每个样本点所对应的近邻类和非近邻类,定义其类内散布和类间散布;最后,通过最大化总体类间散布与总体类内散布之比,使得同一个类别且互相邻近的样本点在投影空间中尽可能的靠近,而相互邻近的类彼此远离。ORL和FERET标准人脸库上的实验结果证实了所提出算法的有效性。2.结合半监督分类算法和流形学习算法,提出一种新的半监督降维算法。该算法首先利用自训练分类算法,在少量的有标记样本点的指导下,确定大量存在的无标记样本点的类别标签,从而实现了样本间聚类的目的;随后,流形学习算法被用来对样本数据进行降维,以便在保持样本局部结构特性的同时,更好的抽取出样本的鉴别特征。具体来讲,该算法首先通过自训练学习来对未标记样本点进行标记,并在每次迭代前借助切边权重统计(cut edge weight statistic)方法来对自标记(self-labeled)样本集进行修正,从而将错分类的未标记样本点移除以减少噪声的影响;然后,对自训练学习所得的训练样本集采用流形学习算法进行维数约简:即根据所确定的未标记样本点的类别标签以及样本间的相似度,对各个样本点所构成的近邻图的边赋予不同的权重,从而使得“同一类别(包括未标记样本点)”邻近的样本点尽可能靠近,而“不同类别(包括未标记样本点)”邻近的样本点尽可能远离。ORL和AR标准人脸库上的实验结果验证了所提出算法的有效性。3.提出一种快速的基于稀疏表示的分类器算法。该算法主要针对基于稀疏表示的分类器(SRC)在计算复杂度上的问题,引入了邻近类的思想,从而节省了非邻近类样本点用于计算测试样本点稀疏表示的时间,达到缩减算法计算复杂度的目的。具体来说,对于每个测试样本点,该算法首先求出其可能归属的类别;而后,利用该测试样点可能归属类的样本数据而并非所有的训练样本来对其进行稀疏表示计算。ORL和FERET标准人脸库上的实验结果表明改进算法不仅能较大程度的缩减算法的计算复杂度,而且排除了干扰类的影响,从而在某种程度上提高了算法的识别率。