基于非负矩阵分解和稀疏表示的人脸识别算法研究

被引量 : 0次 | 上传用户:ydzdems
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为生物特征识别的一个重要的分支,人脸识别逐渐成为了计算机视觉领域的一个热门研究课题,得到了越来越广泛的关注。众多的人脸识别方法被研究人员相继提出,其中,基于表观(Appearance-based)的人脸识别方法由于其简单、实用性强和有效性高等优点,成为了人脸识别的研究热点之一。该类算法通常包括两个重要的过程,即特征提取和分类。本文围绕非负矩阵分解(Non-negative MatrixFactorization,NMF)这种新的特征提取方法,和基于稀疏表示的分类器(SparseRepresentation based Classification, SRC)这种新的分类器展开的。NMF是一种新的特征提取方法。由于具有非负约束,NMF能够提取到训练样本的局部成份。并且,研究发现,人脑是通过事物的局部来感知外界事物的,因此,NMF和人脑感知事物是有联系的。所以,基于NMF的人脸识别方法具有很强的实用价值。近年来,由于其识别率高、鲁棒性强等优点,基于稀疏表示的人脸识别方法受到越来越多科研人员的关注。和传统的子空间学习算法不同,稀疏表示并不关心采用何种特征进行降维,却强调稀疏性和分类器的设计。稀疏表示的研究表明,如果分类器设计的适当的话,选择何种特征降维已经不重要了。因此,基于稀疏表示的人脸识别方法将人脸识别的研究重心引入到分类器设计上。围绕NMF和稀疏表示,本文的创新性成果和主要工作如下:(1)提出了基于光滑性和主成分的NMF (Smoothness and Principal ComponentsBased NMF, SPNMF)算法。通过对NMF的研究,发现NMF收敛慢的原因是基图像含有很多噪声。此外,NMF的系数矩阵相关性较大,不利于识别不同图像。鉴于现有NMF算法的缺点,本文提出了SPNMF算法。首先,将一个常数矩阵添加到基矩阵上,来增强基矩阵的光滑性,同时,平滑噪声点,最终减少NMF的迭代次数;其次,为了提高系数矩阵不同列之间的区分度,将系数矩阵不同列之间的方差增加到NMF的损失函数上,作为惩罚项。最后,在PIE、AR和FERET三个公用的人脸库上进行了大量的实验,结果表明,本文提出的SPNMF算法不但识别率高于NMF,而且速度比NMF快2至4倍,因此,SPNMF具有较强的实用价值。(2)提出了二维非负主成分分析(Two-Dimensional Non-negative PrincipalComponent Analysis,2DNPCA)算法。本文通过对二维主成分分析(Two-DimensionalPrincipal Component Analysis,2DPCA)的研究,发现2DPCA是基于整幅图像的算法,通过最大化特征协方差矩阵的迹来保护总体方差。但是,2DPCA不能提取对人脸识别非常重要的局部成份。受到基于局部特征的NMF算法的启迪,本文将非负约束融入到2DPCA中,提出了2DNPCA算法。2DNPCA是一种基于图像矩阵的方法,能够保持人脸图像的局部结构;并且2DNPCA具有非负限制,能够提取人脸图像的局部成份。因此,2DNPCA同时具备2DPCA和NMF的优点。此外,2DNPCA打破了最小化损失函数的框架,迭代过程中只需提取基矩阵而不用同时提取系数矩阵,使得2DNPCA的速度显著快于传统的基于NMF的算法。在Yale、FERET、AR和Extended Yale B四个标准人脸库上的实验结果表明,2DNPCA是一种非常有效且优于2DPCA、2DLDA、2DLPP和NMF的人脸识别方法。(3)提出了基于梯度的稀疏表示分类器(Gradient-based Sparse RepresentationClassification, GSRC)。近来,尽管基于l1范数和l2范数的稀疏表示对于正面人脸图像识别已经取得了很有前景的识别效果,但是,它们都需要完备的训练字典,这个条件现实中很难满足。本文主要关注如何设计稀疏表示算法来解决不完备训练字典问题。由于图像梯度能够明确地考虑相邻像素点之间的相互关系,而且和图像像素相比,图像梯度对光照变化更不敏感,所以本文将图像梯度融入到稀疏表示框架,提出了GSRC算法。通过将图像像素值和图像梯度相结合,和基于稀疏表示的分类器(SRC)相比,本文提出的GSRC算法具有更小的模型误差,对每个类别要求更少的训练样本。此外,GSRC可以很容易地与传统的特征提取算法结合,并且可以通过正则化最小二乘法求解,使得GSRC速度显著快于SRC。采用Yale、AR、Extended Yale B和CMU PIE四个公用的人脸库进行实验,结果表明GSRC对于不完备训练字典问题和图像遮挡问题都是十分有效的,并且GSRC算法的速度在实际应用中是可以接受的。
其他文献
阐述了燃气电厂噪声的主要来源,结合山西省某采用直接空冷机组的燃气电厂的工程实例,提出了采用直接空冷机组的燃气电厂噪声治理的措施,针对直接空冷系统提出了在直接空冷风
随着信息技术的快速发展,我国涌现出诸多新的零售渠道类型,带来了多渠道零售革命的爆发,主要形式是商业企业线上线下渠道的整合。零售企业线上线下销售渠道的整合情况可以反映
中国的高校历来就是培育社会人才的摇篮,它承载着为社会提供高素质人才的光荣使命。曾几何时,高校的校园有着祥和的学习气氛和生活氛围,同时也引领着比较高深的社会学术潮流,一度
本文介绍一款个性化电子万年历的设计与制作。该款电子万年历带个性化公、农历双行节日提醒、高精度温度显示、时间校对、整点报时、闹钟提醒、自动背光控制、时钟断电依然走
<正>近年来,随着水污染问题的加剧,越来越多的消费者开始重视饮水安全的问题,净水产品得到了消费者的青睐和认可。相关数据显示,2014年净水市场规模达121亿,同比增长66.9%。
<正>水是生命之源,我们每个家庭的日常生活都离不开水,而家庭用水的品质安全不仅直接关系到百姓的身体健康,也关系到社会文明的繁衍及社会的和谐发展。据世界卫生组织调查显
历经六十多年的发展,随着“以人为本”的思想观念在科研和军事领域的不断深入,我国武器研究与开发现已从单纯考虑武器作战性能向舒适性迈进。特别是近年来,随着自适应有源降噪技
<正> 就像人们再熟悉不过的那样,一台微机必需有其人机对话的基本手段——键盘与CRT显示。通过键盘输入信息,通过CRT输出信息,单片机也通过按键——一种简化的键盘来输入信息
目的食管癌(Esophageal Carcinoma,EC)是我国最常见的消化道肿瘤之一,死亡率居恶性肿瘤的前列。宁夏地区是我国食管癌高发地区之一,该地区食管癌的高发符合典型的多基因遗传易感