基于二阶池化和超完备表示的深度学习人脸识别研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:jing8522
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人脸识别一直是学术界和工业界的研究热点。尽管在过去几十年内,研究人员提出了一系列的人脸识别方法。但是由于姿态、表情、光照等外部因素的干扰,这些方法始终不能取得很好的识别效果。卷积神经网络通过逐层地学习样本的特征,能够表示样本的复杂变化,因此在人脸识别领域取得了出色的成绩。在设计网络结构时,常见的卷积神经网络模型主要采用了传统的平均/最大池化层。然而这些池化层只计算了输入特征的一阶信息,比如平均值或最大值,这在一定程度上限制了模型的学习能力。另外,人脸不仅包含全局判别信息,还包含局部判别信息。单一的模型往往只挖掘了其中一部分的判别信息,因此其性能受限于这些判别信息的丢失。为了克服这些问题,本文分别提出基于二阶池化和超完备表示的深度学习人脸识别方法。第一种方法的核心组件是二阶池化卷积神经网络,通过改善传统的池化层,提高模型的学习能力。首先采用若干层的卷积层和池化层将原始的人脸图像变换为特征图。然后将该特征图分解成一组局部特征,并对其中每个局部特征进行外积运算,得到相应的结果矩阵。最后将运算的结果作为平均/最大池化层的输入,这使得传统的池化层能够挖掘输入特征的二阶统计信息,从而学习更加鲁棒的人脸表示。第二种方法的核心组件是多区域卷积神经网络,通过提取和融合不同图像区域的判别信息,使得最终的人脸表示更加完备和更加鲁棒。首先以一张完整的人脸图像和一组人脸区域作为输入,并利用共享层将这张人脸图像变换为特征图,其中共享层是由几个卷积层和池化层组成。然后对于每块人脸区域,区域提取层在该特征图上提取等价的区域特征图,并利用单独的分支网络去学习该区域的特征。最后通过提取和拼接这些区域的特征,得到给定人脸的超完备表示。相比于已有的方法,该模型通过共享低层次的隐藏层,具有更优的计算效率。本文提出的两种模型都在CASIA-Web Face库和LFW库上进行实验和分析,实验结果表明本文的模型能够学习更加有效的人脸表示,从而提高了识别精度。
其他文献
随着网络信息量的急剧增长,人们期待通过一种更加简洁的方式获取信息。传统的搜索引擎只能返回一系列的网页,人们期待通过一种更加简洁的方式获取信息,问答系统应运而生。问
学位
随着网络技术和信息技术的不断进步,数据挖掘引起了人们的广泛关注,传统的信息处理技术越来越不能很好地满足实际应用的需要。因此,人们迫切需要具有更高效率和更强能力的信
作为一种重要的分析复杂系统的方法,时间序列预测在诸如:对太阳黑子数、电力需求和商品物价指数CPI的预测等场合都已取得了广泛应用。其面临的问题之一即在对原时间序列进行
随着影视、游戏,动画产业的飞速发展以及虚拟现实技术的广泛应用,真实世界的场景建模与绘制已经成为一个日益上升的需求,特别是室外大尺度场景。传统的正向建模方式,如使用三维建
随着遥感事业的蓬勃发展,卫星遥感图像受到人们越来越多的关注。高光谱图像作为卫星遥感图像的一个重要分支,其本身具有的高维数据蕴含了丰富的信息待我们深入挖掘。高光谱图像分类问题是现阶段遥感图像研究领域的一个热门问题,该问题涉及计算机图像学、数理统计学、矩阵论等多个学科理论。在高光谱图像分类领域,目前较为流行的分类方法是利用基于统计学习的机器学习分类算法(监督学习方法,无监督学习方法),通过建立分类模型
当前生物信息学中对模体的预测普遍使用聚类算法,而当前大多数模体预测工具及算法在预测顺势调控结合位点时具有一定的局限性,他们往往能有较准确的预测那些与背景序列(模体
多值逻辑是指一切逻辑值的取值数大于2的逻辑。多值逻辑的研究内容主要包括理论、电路与系统和应用三个方面。  多值逻辑函数结构理论包括完备性理论、函数表示理论以及单
在集成电路工艺技术发展的驱动下,异构多核处理器的性能在成倍的增加,但原来系统级的一些问题被引入到处理器内部,任务的调度分配就是问题之一。对于多核CPU,优化操作系统任
如今,镜头规划技术的研究及应用越来越多,本文设计并实现了一个基于知识的智能的镜头规划系统,并将其运用于三维虚拟场景的自动漫游。本文依次讲述镜头知识的表示方法、镜头