基于领域信息损失和注意力动态加权训练的人脸表情识别研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:tgw2000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近几年随着人工智能技术的高速发展,人脸表情识别在智能安防、测谎、智慧医疗、互联网教育等领域出现了广泛的应用场景。由于人们通过面部表达情感的方式不同,很难通过人工设计和选择特征的方法高效的获取人脸面部表情的特征分布,因此目前基于深度卷积神经网络自动提取面部表情特征的方法在人脸表情识别中发挥出越来越大的优势。人脸表情识别任务在计算机视觉领域一直是一个充满挑战的问题,由于人们个体情绪表达的差异性和不受控的环境等因素的干扰,我们很难确切的为每一个表情类别划分特征空间,这样就会导致人脸面部表情类别与类别之间出现定向混分的问题。为了能够减缓人脸表情类别间存在的定向混分问题,本文创新性的提出了领域信息损失函数(Domain Information Loss)通过在目标函数中引入先验的领域信息知识来指导网络模型的训练和特征学习。同时针对人脸表情识别中人脸表情数据集规模不够大的问题,本文提出了Unet-StarGAN对抗生成网络模型来随机生成与训练数据集分布一致且带有标签的人脸表情样本扩充训练数据集,提升网络模型的泛化能力。此外本文设计人脸表情识别的网络模型时在深度卷积神经网络的基础上加入了协方差池化层和残差网络单元模块,这样可以使网络模型有效的捕捉面部关键特征的扭曲程度同时改善网络中层与层间信息的流动,避免出现梯度消失的问题。最后针对多个带有加权系数的损失项函数共同指导网络模型训练的问题,本文创新性的提出了注意力动态加权训练方法,将整个网络模型训练过程划分为三个不同的阶段,通过动态调整每一个阶段不同损失项的加权系数使网络模型在整个训练周期内能够高效合理的进行特征学习,同时避免网络模型过早的出现过拟合。本文所提出的基于领域信息损失和注意力动态加权训练的方法在显著提升人脸表情识别性能的同时减缓了表情类别间存在定向混分的问题。为了评估本文所提出方法的有效性本文分别在RAF-DB和FER-2013数据集上做了相关实验,实验结果表明本文的方法在RAF-DB数据集上目前取得了业界上最好的识别准确率,在FER-2013数据集上取得了非常有竞争力的识别水平。
其他文献
由于采用优化的原型滤波响应,滤波器组多载波(Filter Bank Based Multicarrier,FBMC)的根本优点在于其优秀的频谱密度集中(或等价为旁瓣抑制)特性。由于对用户的同步要求较低,FBMC对于一些异步多用户场景非常有吸引力,如蜂窝系统的上行传输和感知无线电。基于上述背景,本文首先分析并推导了FBMC系统的数学模型,并对FBMC系统中的关键技术:同步技术、信道估计和峰均比(Pe
密集异构网络作为5G系统的关键使能技术之一,可有效提高网络容量与数据传输速率。然而,随着SBSs的大规模密集部署,密集异构网络技术优势的充分发挥与实现必须克服各种技术难
作为第五代移动通信系统的候选关键技术,大规模多输入多输出(Multiple Input Multiple Output,MIMO)技术由于高频谱效率和低发射功耗等优势,得到业界的广泛关注。然而,大规模
传统封闭的网络体系被软件定义网络的分层思想解耦为数据平面、控制平面和应用平面,网络的集中控制与管理在逻辑上得到了实现。集中管控的机制和开放的编程接口增加了SDN管理
作为物联网的关键组成部分之一,机器与机器(Machine to Machine,M2M)通信能够借助无处不在的移动通信网络,无需在人的参与和干扰下实现各种数据测量和采集,完成全自动化的信
目的:检测VEGF-C蛋白在鼻咽癌肿瘤组织中的表达及VEGF-C对人淋巴管内皮细胞生物学行为的影响,分析VEGF-C表达与鼻咽癌临床病理特征的关系,探讨鼻咽癌淋巴转移的机制,为鼻咽癌
间断连接无线网络(Intermittently Connected Wireless Network,ICWN)是一种无需固定网络基础设施且能轻松部署的自组织网络,因此,其多应用于紧急通信建网及军事领域。节点间
青少年是新时代中国特色社会主义事业的建设者和接班人,他们的思想道德建设水平将直接影响到未来中华民族的发展。随着城镇化进程的加快,城中村作为城镇化进程中的产物,发生着翻天覆地的变化。城中村青少年作为青少年群体中的一部分,有着其独特的思想状态和特点。随着物质生活条件逐步提高,他们的视野逐渐开阔,这些状况给城中村青少年的现代教育带来益处的同时,也给城中村的思想道德教育带来了不同程度的负面影响。在这种背景
天发船收高频雷达是一种天波-地波混合体制的新型雷达,该雷达兼具天波雷达、地波雷达和舰载雷达的优点,具有超视距探测、隐身目标探测、超低空探测的优势,因此研究天发船收高频雷达具有重要的战略意义。目标状态估计是天发船收高频雷达数据处理的重要组成部分,在数据处理的过程中起着重要的作用,状态估计算法的性能决定着滤波精度和航迹跟踪效果。本课题针对天发船收高频雷达的工作特点研究该雷达体制下的目标状态估计方法。通
不平衡数据集主要是可以分为类间的不平衡和类内不平衡。类间不平衡指的是不同类别之间的样本数目差别较大;类内不平衡是指在某一个类别的内部,不同部分的数据分布成不同的簇(Cluster),不同的簇之间样本数目差距较大的情况。因为大多数的传统的机器学习方法默认使用的数据样本相互之间是平等的,并且假设其数据量是相对平衡的,所以数据集不平衡问题的最根本难点是样本的不平衡性往往会显著地影响大多数机器学习方法的性