基于时空流间注意力机制的表情识别研究

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:weiwen2100000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
面部表情识别属于模式识别领域的一种特殊且广泛的应用。面部表情存在时间尺度上的动态变化,所以结合表情纹理变化信息的动态表情识别具有重大意义。双流卷积神经网络是常用的动态表情识别模型,但其两条支路提取特征的过程相对独立,无法充分建立支路之间的联系,所以该模型仍有非常大的改进空间。近年来,不同形式的注意力机制被引入卷积神经网络中,可以赋予网络对特征非局部学习的能力,为图像分类等任务提供了一种新的思路。本文结合注意力机制实现双流卷积神经网络两条支路的信息交互,主要研究工作和成果如下:(1)针对某一尺度的特征图不能自发地学习与另一尺度特征图之间的动态关联信息的问题,提出了一种具有非局部操作的时空流间注意力机制。时空流间注意力单元可以使分别来自空域和时域尺度的两个特征图互相学习局部显著区域信息,从而捕捉空域和时域两个语义层次的动态关联信息,使特征更具鉴别性。(2)针对传统的双流卷积神经网络模型两条支路提取特征的过程缺乏信息交互的问题,将时空流间注意力单元引入双流卷积神经网络,进而提出了一种嵌入时空流间注意力的双流卷积神经网络模型。该模型建立了两条支路的动态联系,可以提高对表情分类的精确性和鲁棒性。本文分别以VGG-16和ResNet-50作为所提出模型的基准网络,通过在模型的不同位置嵌入若干个时空流间注意力单元,可以在网络的任意位置实现两个尺度特征的信息交互。(3)使用嵌入时空流间注意力的双流卷积神经网络模型对eNTERFACE和AFEW两个动态表情数据集的样本进行分类,验证了该模型在面部表情识别任务中的有效性。实验分为分析传统双流卷积神经网络模型的实验性能和分析嵌入时空流间注意力的双流卷积神经网络模型的实验性能两个部分。结果表明,在双流卷积神经网络中嵌入时空流间注意力单元可以提高模型对表情样本的分类准确率。其中,以ResNet-50为基准网络的嵌入时空流间注意力的双流卷积神经网络模型对eNTERFACE和AFEW数据集样本的分类准确率分别达到55.83%和54.57%,比传统双流卷积神经网络模型的准确率高3.33%和2.09%。(4)建立了一个新生儿疼痛动态面部表情数据集,其中的样本被标记为“平静”、“啼哭”、“中度疼痛”或“重度疼痛”四个类别。使用嵌入时空流间注意力的双流卷积神经网络模型对该数据集的样本进行了多组消融实验,其分类准确率高于其他常用的表情识别模型。其中,以ResNet-50为基准网络的嵌入时空流间注意力的双流卷积神经网络模型在基于四种类别的新生儿疼痛表情识别中取得66.20%的分类准确率。
其他文献
目的:中性粒细胞哮喘作为哮喘的一种特殊类型,临床症状控制差,急性加重频繁,对糖皮质激素治疗不敏感。骨髓间充质干细胞(mesenchymal stem cells,MSCs)已明确可在嗜酸性粒细胞哮喘中发挥治疗作用,但对中性粒细胞哮喘的治疗效果仍需要更多的研究证实。芳香烃受体(Aryl hydrocarbon receptor,Ah R)作为一种配体激活性转录因子,在生物体内广泛表达,参与许多重要的
杉木(Cunninghamia lanceolata)作为我国人工林的重要组成部分,在木材加工、经济建设和生态环境保护方面有十分重要的作用。但杉木存在结构疏松、材质轻软、强度低、易燃等缺陷,限制了其在家具、地板、木结构等领域的广泛应用。杉木中闭塞纹孔的存在使得改性剂渗透困难;现有改性方法难以获得理想效果,导致杉木改性研究进展缓慢。针对此,本文以人工林速生杉木为研究对象,采用硅酸盐为浸渍改性剂,通过
目的:分析湿疹样银屑病的临床特征,探讨湿疹样银屑病的发病机制,重点对多种与银屑病或特应性皮炎发病相关的细胞因子、B细胞亚群的特征进行研究。材料和方法:选择2015年11月到2017年2月在瑞金医院皮肤科门诊及病房就诊的6例湿疹样银屑病患者作为病例组;同时收集16例寻常型银屑病患者、8例特应性皮炎患者作为对照组,采用电化学发光法分别检测患者血清、尿液中的IL-1β,IFN-γ、IL-4、IL-5,I
目的我们拟在细胞水平观察瘦素对椎体和长骨骺板增生和分化不同影响的时间和浓度依赖效应。瘦素在椎体骺板生长代谢中有其不同于长骨的特异性作用,但具体机制还不清楚。本研究拟在细胞水平研究STAT和ERK信号通路在瘦素对椎体骺板增生、分化和凋亡影响中特定意义,和长骨骺板比较观察其部位特异性,推断瘦素对椎体和长骨生长发育影响可能借助的特定信号途径。方法选择一周龄雌性小鼠(C57BL/6),取其椎体和长骨骺板软
忆阻器以其阻值连续可调,纳米级尺寸,低功耗等类突触优势成为当下人工突触的首选。联合式学习和非联合式学习是生物学习的基本方式,使用忆阻器作为人工突触模拟生物的学习行为是进一步研究神经形态系统的基础和关键。基于忆阻器的物理模型改进其数学模型,使其具有与突触行为适配的性能,可以指导其设计制造工艺以提高其仿生突触性能。本文介绍多种忆阻器模型,最后选用惠普忆阻器模型和氧化钨遗忘忆阻器作为突触模拟生物行为,构
近年来,深度学习技术在很多应用领域中均获得了突破性的进展,其优异性能取决于大量标记数据训练的监督学习,由于在实际场景中,大量的已标记数据很难获取,域自适应方法提出用已训练好的有标记的源域深度模型应用到没有标记的目标域中,但是,源域和目标域往往存在域偏移,为了解决这一问题,本文在无监督域自适应算法基础之上,引入度量学习以提高目标域样本的分类准确率,具体做法如下:(1)为了提高无标记目标域的分类精度,
目的本研究主要探讨早产儿视网膜病变(Retinopathy of Prematurity,ROP)抗新生血管治疗的效果,治疗后病变复发的高危时间和高危因素;研究ROP患者眼内细胞因子浓度和细胞外循环mi RNAs表达谱,探索ROP的分子遗传机制。材料与方法(1)回顾性分析接受单次雷珠单抗玻璃体腔内注射治疗的50例1型ROP的早产儿的50只眼,治疗时矫正孕周35.5±1.3周,通过Retcam广角数
目的:通过前瞻性随机对照研究(RCT),明确静脉激素冲击联合甲氨蝶呤和单纯静脉冲击在治疗中重度活动期甲状腺相关眼病(TAO)中的作用,对比二者的有效性和安全性,为制定中重度活动期TAO治疗规范提供循证医学证据。同时,比较患者黄斑中心凹下脉络膜厚度(SFCT),及该指标在激素治疗前后的差异,为TAO提供分期分级和疗效评估的辅助指标。方法:2016年1月至2017年1月于我院确诊TAO的患者共125例
研究背景与目的:肥厚型心肌病(HCM)是一类以室间隔非对称性肥厚为基本特征的遗传性心肌病,主要的病理生理学表现为收缩期二尖瓣前向运动(SAM)和动力性左室流出道梗阻(LVOTO)。根据是否存在LVOTO,将HCM分为肥厚型梗阻性心肌病(HOCM)以及肥厚型非梗阻性心肌病。外科手术是解除难治性LVOTO的金标准,但对于HOCM合并二尖瓣反流(MR)的治疗策略一直存在争议。本课题旨在通过回顾性分析本心
目的1.研究PLEK2在胆囊癌组织中的表达及其与临床预后的关系。2.研究PLEK2对胆囊癌细胞迁移、侵袭的影响,并在体内进一步证实PLEK2对胆囊癌转移的增强作用,为临床寻找靶向治疗药物提供实验基础。3.探讨PLEK2促进胆囊癌细胞迁移、侵袭的分子机制。方法1.从医院收集6对转移的胆囊癌和癌旁组织制成m RNA表达谱芯片,从表达升高最明显的20个基因中,我们筛选出PLEK2基因。扩大样本到10对转