基于多尺度3D残差注意力网络的视频人脸表情识别

来源 :长安大学 | 被引量 : 0次 | 上传用户:dddnnn111111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
表情是人类情感表达的重要方式之一。近年来,随着模式识别技术的发展,人脸表情识别(FER)渐渐成为人工智能领域的研究热点,在人机交互、智能监控、疲劳驾驶等众多领域有着广泛的应用。目前FER的方法以静态表情图像研究为主,由于静态表情仅包含有限的纹理和轮廓信息,导致人脸表情识别的精度低、泛化性差。然而,表情的表达实质上是一个变化的过程,动态的视频表情序列包含丰富的空间信息和上下文活动信息,能够大幅提升分类结果的精度,因此研究意义深远。本文提出了多尺度三维残差注意力网络(3D-Res Att Net)的视频人脸表情识别。该网络将注意力机制与前馈网络结合形成注意力卷积神经网络,通过堆叠注意力模块构建三维残差注意力网络,这些模块会生成注意力感知功能,随着网络的深入,来自不同模块的注意力感知功能可以自适应地变化,能够提高人脸表情识别的精度。其中注意力模块采用自下而上、自上而下的前馈结构对特征增加软权重,学习更重要的人脸表情识别信息。除此之外,为了防止因为网络较深引起网络性能退化的问题,本文采用了注意力残差学习。针对3DCNN网络的计算复杂度较大,导致训练时间和计算机硬件的要求都大幅增加,为了降低模型的复杂度,本文采用分离卷积的思想,设计了伪三维残差块P3DA进行特征提取,伪三维卷积神经网络相比于普通的三维卷积神经网络在参数数量、计算复杂度等方面得到了大幅减小。针对样本不足的问题,本文不仅对样本数据进行旋转增强,还对样本进行尺度缩放,既避免了3D-Res Att Net网络过拟合的发生,同时也使网络对样本具有尺度不变性。与常见的视频表情识别方法相比,该方法可以同时提取时间和空间特征,网络结构简单,能够实现端到端的学习。实验结果表明,本文模型在CK+、Oulu-CASIA和MMI三个公开数据集上分别获得了99.6%、92.4%和81.2%的Top-1准确率,超过了现有先进方法的识别结果,充分说明了本文模型3D-Res Att Net对表情序列的时空信息有较强的表示能力,有效提高了表情识别的准确率。
其他文献
近年来,金属硫化物因其具有较多活性位点、禁带宽度窄、对可见光吸收强等特点[1],在光催化、光学、光电化学等领域得到广泛应用,但是仍需提升其催化活性和耐久性,在各种提升方法中,与其他材料复合构筑异质材料是一个有效途径。本文在课题组工作基础上,我们分别选取Mo S_2、Bi_2S_3、Cd S作为主研究材料,采用不同方法将它们分别与其他半导体材料进行复合,构筑异质复合半导体材料,进而探究异质复合材料在
紫竹(Phyllostachys nigra(Lodd.ex Lindl.)Munro),属于禾本科竹亚科刚竹属植物,主要分布于江苏、浙江、安徽、湖北、福建及陕西等地。《草木便方》、《重庆草药》中均记载了
全民健身的提出可追溯到1995年。当年,第八届全国人民代表大会常务委员会第十五次会议通过了《中华人民共和国体育法》,同年国务院颁布了《全民健身计划纲要》,在接下来的25年历程中,全民健身上升成为国家战略。多年来,西宁市积极响应国家号召,组织开展全民健身活动,举办各类群众性体育赛事,极大地丰富了广大人民群众的精神文化生活,全民健身活动取得了明显的成效,为西宁经济社会的发展做出了重要贡献。在此背景下,
中国房地产的黄金期已渐行渐远,随便拿一块地靠捂盘赚钱的年代一去不复返,竞争加剧、库存遍地、地价高企、融资压力巨大已经成为了中国房地产企业需要面对的新常态。作为国家
为了解决大医院人满为患和基层群众就医难的矛盾,我国开始推行医疗联合体制度。经过多年的发展,湖北省秭归县医疗联合体运行状况良好,取得了一定的成效:降低了政府的投入成本,降低了医院的经营成本,降低了患者的就医成本,达成了三方共赢的局面;强化了医疗卫生机构和医疗队伍建设,医疗服务水平迈向新台阶;发挥了分级转诊平台优势,分级诊疗制度开始实施;加强了信息化建设,智慧医疗平台获得初步构建;促进了现有人力和物力
为了筛选出耐盐能力强的柽柳品系,并确定适宜的柽柳耐盐试验指标体系和高效试验方法,本研究以20个柽柳品系为试材,进行了三种类型的耐盐试验:带根苗梯度盐土栽植、带根苗梯度盐液水培和梯度盐液扦插试验。通过观测植株盐害症状,实测其生理指标、表型指标,进行了不同试验方法的效果评价和耐盐品系的筛选。主要结果如下:三种试验均显示:参试品系的各项生理指标、表型指标在不同盐分浓度间均存在显著差异,盐分逆境对参试品系
风能是一种清洁、安全、可再生的绿色能源,利用风能对于人类社会可持续发展具有重要意义,风力发电目前已在全球范围内迅速发展。变桨轴承是风力发电机组的关键零部件,变桨轴承通过螺栓与轮毂及叶片根部相连接,经变桨控制系统驱动而调整叶片的角度来控制风轮的转速,进而控制风机的输出功率。变桨轴承在工作中受轴向载荷、径向载荷及倾覆力矩作用,工况载荷复杂、运行环境差。变桨轴承的安全性及可靠性关系着风力发电机组的整体稳
近年来,幼教师资队伍性别结构失衡困境引发社会和诸多学者广泛讨论,男教师进入学前教育领域后,并未像大众期待那般,实现自我价值。而是在现实社会环境和幼儿园教育生活条件下,职业状况逐步陷入新型危机,诸多新鲜血液急速流失,幼儿园男教师生存再次面临威胁。立足于此,通过相关文献梳理发现,幼儿园男教师难以实现职业适应是致使人才流失的重要缘由,是幼儿园男教师不断离职的根源所在。为进一步厘清幼儿园男教师的职业适应真
目的:观察不同光照强度对负透镜诱导性近视豚鼠屈光发育的影响及巩膜上BMP-2(骨形态发育蛋白-2)的表达的变化。方法:选择2周龄的SPF级三色豚鼠30只,以随机数字表法随机分为强光组10只、正常光照组10只、弱光组10只。三组光照强度分别是,强光组:10000Lux模拟室外阴天的光照强度,正常光照组:500Lux模拟正常室内光照强度,弱光组:5Lux模拟弱光环境光照强度。每只豚鼠右眼予以-700度
在农业上,荧光探针经常用于检查农副产品的纯度、鉴定种子的生活力以及鉴定果实成熟程度等。苯并噻唑类衍生物由于具有优良的荧光性能,被广泛用于设计识别离子或者小分子的荧光探针,本论文设计合成了七个基于苯并噻唑的衍生物,研究了其中三个衍生物R1-R3分别与阳离子、阴离子、半胱氨酸(Cys)、高半胱氨酸(Hcy)和谷胱甘肽(GSH)作用的光谱性质和响应机理,主要内容和结果如下:1.设计合成了荧光探针R1。以