基于图像频率域特征学习的人脸表情识别

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:samhsa
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人脸表情识别是近几十年来新兴的研究课题,在心理学和计算机视觉等领域具有重要的意义。与传统的机器学习相比,深度学习在特征提取方面具有优越的性能。在基于深度学习的表情识别研究中,卷积神经网络(CNN)的使用较为广泛。然而,性能优异的模型通常由复杂的卷积结构组成,伴随着巨大的计算量。另一方面,在频率域中处理图像具有一定的优势。然而,目前与频域相关的表情识别研究局限于传统手工设计的方法。因此,本文结合深度学习与频域处理的优势,设计并实现在图像频率域中进行特征学习的神经网络,旨在以轻量的计算获得优异的表情识别效果。本文的创新点主要有:1.本文设计了图像频率域的特征学习机制。具体而言,本文首先设计了可学习的频率域滤波核,并以此为核心设计了频率域特征提取层。然后,本文在特征提取层的基础上设计了频率域特征汇总层,从而进一步提取图像的高层特征。2.本文提出了基础型频域神经网络(Basic-Fre Net)。根据离散余弦变换(DCT)能量集中的性质,本文利用频率域特征提取层和特征汇总层设计了Basic-Fre Net,并实现了本文的第一种表情识别算法。3.本文提出了频率域特征与卷积特征融合的神经网络(DFN-Fre Net)。通过分析Basic-Fre Net和CNN的不同特点,本文设计了特征融合的机制对频率域特征和卷积特征进行融合,从而构建了DFN-Fre Net并实现了本文的第二种表情识别算法。4.本文提出了分块型频域神经网络(Block-Fre Net)。通过对Basic-Fre Net和DFN-Fre Net的分析,本文在特征提取方面改进了频率域滤波核、在特征降维方面设计了块子采样,从而构建了Block-Fre Net,即本文的第三种表情识别算法。实验结果表明,本文在频域中提出的特征学习机制是有效的,基于此构建的频域神经网络能够实现人脸表情识别。其中,Basic-Fre Net能够在广泛使用的DCT特征上获得更有效的特征,从而达到相对更高的表情识别准确率。另外,在模型DFN-Fre Net中,Basic-Fre Net与CNN的结合能够提高表情识别的准确率。最后,Block-Fre Net能够以轻量的计算获得优异的表情识别效果。
其他文献
在编码衍射成像系统中,仅依靠多个编码衍射图案就可以重构出较高质量的图像。但在编码衍射图案较少并且受噪声污染的情况下,却很难重构出较高质量的图像。为了解决此问题,该文利用即插即用先验模型与神经网络来提高重构图像的质量。具体研究内容如下:首先,鉴于图像先验对解决图像反问题具有极其重要的作用,该文利用非局部均值(Non-Local Means,NLM)去噪算子将丰富的图像先验引入到编码衍射成像模型中,来
贯彻落实中央八项规定精神,对于国税部门来说,就是要围绕“照镜子、正衣冠、洗洗澡、治治病”的总体要求,以为民务实清廉为目标,切实履行为国聚财、为民收税的神圣使命。重学
由于地质、水文、土壤等种种因素,我国西南、西北地区滑坡灾害频发,严重影响到人们的日常生活以及生命财产安全。同样,位于阿尔卑斯山附近的意大利也是滑坡多发地,国外地质研究学者专门针对该地区滑坡问题进行跟踪调查和研究,并提出了有效的预防和解决方案。因此,对灾害进行合理评估并采取预防措施尤其重要,可以作为我国处理滑坡事件的参考范本,借鉴国外先进地质学经验,结合我国实际,从而将灾害减到最低。本文是一篇地质英
根据《中国城市流动人口社会融合评估报告》,2018年中国2.41亿人处于流动状态,《国家新型城镇化的规划(2014-2020年)》要求到十三五期末,我国常住人口的城镇化率达到60%,农民
近年来,随着我国各大航空公司拥有的飞机数量逐年上升,为满足日渐庞大的飞机维修市场,飞机维修企业所用到的地面设备逐渐向多样化、自动化方向发展。飞机维修过程中设备的正常运行对于维修质量和生产时间起到了至关重要的作用。一旦维修设备出现故障,飞机维修工作将不能顺利进行,并且会耽误航空公司原有飞行任务,对公司甚至国家造成巨大的经济损失。所以设备的日常维护管理工作日益被企业管理者们所重视。本文在对国内外设备保
学位
运动目标检测是计算机视觉和人工智能领域中的重要研究内容。由于现实场景受到气候、光照等外界因素的影响,背景环境会出现不同程度的变化导致基于背景模型的目标检测算法无法取得理想的检测效果。基于低秩与稀疏分解表示的鲁棒性主成分分析(RPCA)成为了运动目标检测的主流方法,但是RPCA模型运用于动态背景下的运动目标检测时存在抗噪性不强、目标与背景像素近似时容易导致提取目标不完整等问题。本文对RPCA模型进行
随着移动互联网的发展,搭载着Android系统的移动设备层出不穷,尤其是Android智能手机的市场占有率保持着逐年上升的趋势,在2019年占到了87%的市场份额。但是由于Android系统
学位
随着无线通信和互联网技术的飞速发展,以手机和平板电脑为代表的移动设备迅速普及,用户对多媒体信息的需求呈爆炸式增长。在各种多媒体信息内容中,网络视频由于其内容的丰富性而成为网络用户的主要选择,因此,和网络视频相关的研究一直不曾间断。流媒体传输技术是网络视频行业的核心技术和研究热点,而在流媒体传输技术中,基于HTTP的动态自适应流媒体技术(DASH)是当前业界最为主流的流媒体传输技术,它的特点就是支持