基于深度学习的面部表情识别方法研究

来源 :上海工程技术大学 | 被引量 : 0次 | 上传用户:damai123123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机视觉技术的快速发展,人脸面部表情识别技术被越来越广泛地应用于疲劳驾驶检测、智慧医疗、远程网络课堂等一系列智能化人机交互场景之中。近年来,尽管面部表情识别技术在不断发展和进步,但该领域仍然存在一些难点问题有待解决。首先,受到性别、年龄以及不同人对同一类表情的表达方式各异等因素的影响,同种类别的表情因人脸图像采集对象的不同存在较大的差异性。此外,图片中的人脸存在不同偏转姿势、人脸被遮挡以及图像采集环境的不同等差异性因素均给表情识别任务带来挑战。因此,解决或缓解上述问题是构建一个更为高效、精准的面部表情识别系统的关键。本文构建的基于深度学习的表情识别系统包括人脸检测与对齐模块、表情识别网络两部分。其中人脸检测与对齐模块通过MTCNN网络完成对人脸及面部特征点的检测,然后根据检测到的面部特征点利用仿射变换实现人脸对齐,最后对裁剪后的人脸图像进行直方图均衡化处理实现人脸图像增强。经上述处理后,再将裁剪好的人脸图像输入表情识别网络实现特征提取并完成表情分类任务。本文的主要工作和创新点如下:(1)通道注意力机制的引入本文先选用常用的CK+数据集用于模型评估,首先结合CK+数据集样本数量较少的特点,以层数相对较浅的VGG11网络为基础,对VGG11部分结构修改后确定表情识别网络的主体base1_net。然后,针对传统卷积神经网络所提取的特征图无法表示各特征通道间重要程度的现象,通过在base1_net的基础上引入通道注意力机制解决了上述问题。(2)多损失函数联合监督训练针对传统softmax损失函数无法度量同种类别的类内间距问题,通过引入中心损失函数,采用softmax损失与中心损失联合监督训练的方式训练表情识别网络,以达到缩小类内间距扩大类间距离的目的,进而提高了模型的鲁棒性。表情识别网络base1_net在引入通道注意力机制和中心损失后,本文将其命名为v1_net。(3)空间注意力机制的引入为了提高模型在更具挑战性的FER2013数据集上的识别准确率,本文对v1_net表情识别网络作了进一步的改进。首先,结合FER2013数据集的数据量明显大于CK+数据集的特点,在v1_net的基础上加深主体网络base1_net的网络层数得到v2_net。然后针对FER2013数据集中存在部分样本因人脸偏转角度过大或面部被遮挡等因素导致人脸检测及对齐模块失效的现象,提出在v2_net模型中引入空间注意力机制的方法来缓解此类问题。(4)训练方法的优化采用随机权重平均SWA训练策略对传统SGD训练方法进行优化,通过在训练表情识别网络的中后期阶段对搜寻到的解进行累加取平均操作使得训练得到的模型具有更强的泛化能力,可进一步提高表情识别网络在测试集上的识别准确率。
其他文献
“农超对接”在我国农产品流通中具有十分重要的作用。“农超对接”顺应现代农业发展趋势,推动现代农业与零售业高效对接,实现了农产品供应链转型和升级,在一定程度上帮助农
未成年人倾斜保护是一项重要的国家伦理,保护未成年人免受性侵害是其中一项重要内容。自上世纪中叶建立性犯罪信息登记制度以来,美国至今已建立了覆盖全国的性犯罪信息登记与公示制度作为事前预防性犯罪的有力措施。司法维度上,美国联邦最高法院已在众多案例中对该制度的合宪性进行了充分讨论,如是否构成对性犯罪者权利的不合理限制,是否违反“事后立法禁止”、“双重危险禁止”、“正当程序”等宪法原则。我国若欲通过性犯罪信
随着我国经济发展进入新常态,既要保持经济稳定增长,还要优化经济结构,向中高端水平迈进。在此形势下,“科教兴国”、“人才强国”等发展战略定位逐渐凸显,我国持续加大对R&D经费的投入,加快提升创新能力。但伴随房价快速上涨,资金“脱实向虚”可能一定程度上会挤占创新研发投入,进而影响城市创新能力的提升。同时,房地产的过度繁荣发展带来了如市场资金相对匮乏、城市居民生活成本、企业运营成本增加等诸多城市
目的:描述和分析贵州省高校大学生网络欺凌的流行现状和影响因素,为制定出相应的干预政策和防治措施提供依据。方法:采用多阶段分层整群随机抽样方法在贵州抽取3个地区6所高校55个班级共2669名学生,应用受网络欺凌行为问卷和自编网络欺凌影响因素调查表进行调查;采用Cronbach’α系数、折半信度系数和因子分析法进行问卷的信效度分析;影响因素的单因素分析采用χ2检验和Z检验,多因素分析采用传统单水平Lo
随着工业的发展,被控系统变得越来越复杂。在实际工程操作过程中,各种不确定性例如时滞、磁滞、死区等无处不在,它们的存在将会增加控制器设计的难度,影响系统的性能,甚至会导致振荡的产生,使系统不稳定无法正常运转,造成不必要的损失。因此对于实际工程的安全保障而言,学术界很有必要深入研究不确定非线性系统。此外,现在的一些工程项目常常对控制性能有一定的要求,因此需要设计控制算法,在保证被控系统稳定性的基础上提
Sirtuins是NAD+依赖的组蛋白去乙酰化酶,在调控新陈代谢和细胞内稳态方面有重要作用。SirT7是这个家族中唯一一个核仁定位的蛋白,能够与RNA PolⅠ结合,在rDNA的转录上起着至
为了便于协同设计、虚拟建筑和施工过程管理,建筑信息模型(Building Information Model,BIM)正在成为土木工程领域的重要工具。BIM技术的飞速发展,给建筑业带来的变革有目共睹。然而建筑业常用的BIM体系3D建模软件缺少岩土材料的材质属性,使其很难与常用岩土工程计算软件(如FLAC3D、ANSYS等)对接,不利于岩土工程领域BIM技术的发展。本文在深入理解BIM理念的基础上,
华北地区作为我国开采历史较长的煤田,经过长时间回采地质条件较好的部分已逐步回采完毕,转向地质条件更加复杂的深部和边缘地区寻找煤炭资源。随之而来的溃砂溃水、底板岩溶水害的威胁日益突出。目前对奥灰大型突水事故,如陷落柱、断层等常规通道已经有了较为有利的治理手段,大型突水事故逐渐减少,而事故的发生正在逐步转向隐蔽。济宁矿区是华北型煤田非典型大水矿区,历史上发生奥灰水突水事故较少。在该区域奥灰水害远距3煤
随着计算机科学技术的日益成熟,如何让计算机理解多媒体中的信息已经成为计算机视觉领域的研究重点,其中图像识别已经取得了惊人的成果,但视频理解仍然面临着诸多挑战。“微动作”识别是指识别视频中人体的细微动作,这些动作无法进行伪装,可以直接反映人隐藏的真实心理状态。“微动作”的分析可应用于测谎、政治心理学分析等领域。不管在面试社交还是刑事审讯的场景中,对“微动作”的识别和分析都发挥着不可或缺的作用。传统的
随着宏观环境的变化,城投公司正在经历一次市场化的转型升级,期间将面临各种各样地风险挑战。本文立足已有研究成果和自身实践经验,以贵州省KY公司为例,分析城投公司目前的财务状况。并运用科学方法,评价城投公司财务风险的大小,结合发现的财务风险,提出针对性的意见和建议。研究发现:(1)现阶段城投公司的财务风险具有共同性,都面临主营业务不突出,营业利润不高;资产质量没有显著提升,转型进度相对较慢;债务风险已