深度信息交互机制下的微表情识别研究

来源 :江南大学 | 被引量 : 0次 | 上传用户:wxiaof
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社会各方的需求、信息化的推进以及计算机视觉的发展,微表情识别领域得到了越来越多的关注,研究人员对其所进行的研究越来越深入。在商务谈判、刑事审讯、心理治疗等场合中人们会有意无意的隐藏自己的真实情绪以此来达到他们的目的,微表情是人类的肌肉语言,在此类情况下使用微表情识别的结果作为判断依据,可靠性则会大大提升。微表情区别于寻常宏表情的显著特点:(1)持续时间短(1/25-1/5秒);(2)肌肉运动幅度小。并且由于微表情捕捉困难,采集工作复杂(需要专业的心理学研究人员设置在特定),导致了现有公开可供研究的数据集稀少,给微表情领域的研究造成了巨大的阻碍,限制了微表情识别技术的发展。针对上述问题,论文基于深度学习方法对微表情识别展开深入研究。主要研究了基于网络之间不同模态、不同域信息交互来提高现阶段微表情识别准确率。通过融合不同信息获得来自空间域和时间域更加丰富的知识来优化参数,网络在有限的数据样本下获得更多知识,同时也缓解了单一标签监督训练所造成的过拟合情况,最终提高网络的预测能力。主要的研究成果为:(1)针对单一网络难以提取丰富的时-空特征,为了丰富网络知识提出基于辅助网络信息交互的微表情识别算法,通过改进的深度互学习策略引导图像序列不同模态之间的交互训练,提高网络的识别率。算法基于灰度图像序列建立主体网络,基于光流建立辅助网络。在训练阶段,通过设计互学习损失中的有监督学习损失和拟态损失,优化训练过程,使得每一种模态都能学习正确地预测训练样本的真实标识,同时能与其它模态的预测相匹配。在测试阶段,由于互学习机制增强了灰度分支的判别能力,因此可对光流分支进行剪裁,在保证准确率的前提下提高识别速度。本实验采用五折交叉验证,最终本方法在SMIC数据库上准确率为75.76%,在CASEM、CASMEⅡ、SMIC合并的数据库上结果为60.52%。(2)针对单一网络难以学习到微表情序列丰富的时间域信息,提出双流网络时间域信息交互的微表情识别方法,构建了双流时间域信息交互卷积神经网络(Dual Scale Temporal Interactive Convolution Neural Network,DSTICNN),网络对微表情序列进行处理,进而实现微表情自动识别。该算法通过改进深度互学习策略引导网络学习同一图像序列的不同时间域信息,来提高最终的识别率。算法基于不同时间尺度构建DSTICNN32和DSTICNN64,在训练阶段改良了深度互学习的损失函数。同时,在两流网络接近决策层的特征图加上了均方差损失,最终由交叉熵损失、JS散度损失和均方差损失来共同监督训练,使得两流网络互相学习加强,提高各自预测样本的能力。本实验采用留一目标验证法,最终在SMIC数据库取得最好准确率为85.93%,在CASMEⅡ数据库取得最好结果为83.65%。(3)为了丰富网络的时-空特征预测能力,提出了基于金字塔增强时-空信息交互的微表情识别。该算法通过利用特征金字塔的技术分别构建了时间增强信息以及空间信息的网络,以此来获得丰富的时间、空间特征。对2D-Resnet34网络进行时间维度上的膨胀来构建的时间增强型网络中,通过对卷积和池化层的设置,控制网络中不同4个stage的特征图空间维度保持一致,仅改变时间维度的大小,再将其每个阶段最后的特征图像进行时间维度归一化,自顶而下连接形成特征金字塔,最终进行微表情预测。同理,构建空间增强型网络控制网络每个阶段特征图像时间维度不改变时间维度仅变化空间维度。网络对微表情序列训练的过程中,自身能够学习到丰富的时间或者空间信息,对微表情序列做出预测。与此同时,该方法还引入了互学习的策略,在训练过程中对空间增强型网络和时间增强型网络的预测结果之间进行信息交互,使得双流网络不仅因为特征金字塔增强时(空)间信息,而且通过网络交互也增加了对空(时)间知识。本实验采用留一目标验证法,最终在SMIC数据库取得最好准确率为87.14%,在CASMEⅡ数据库取得最好结果为87.31%
其他文献
发展氢能是全球应对气候变化的共同措施,同时也是我国实现碳达峰、碳中和的重要路径。氢能产业链条长,涉及环节多,技术体系复杂,通过分析研究氢能全产业链技术体系发展现状,总结了我国在制氢、储运、应用各环节的优势与不足,并针对性的提出相关建议。
汤亭亭是极具影响力的华裔美国作家,其代表作《女勇士》抨击了传统中国社会对女性的压迫和美国主流社会对华裔的种族歧视,构建了华裔美国女性新身份。对《女勇士》中文化身份的研究一直是国内外华裔文学研究的热点。文化身份是我国20世纪90年代从西方引进的概念,也可称为文化认同,是以文化形态为基础、自己或他人认定的社会性建构,主要由人的身体特征、民族、宗教、语言和生活方式等文化节点构建,包括种族和性别等。目前对
目的:靶向脂质代谢关键酶研发抗乳腺癌药物已经成为近年来乳腺癌药理学研究的热点。硬脂酰辅酶A去饱和酶1(stearoyl-CoA desaturase 1,SCD-1)是催化饱和脂肪酸(saturated fatty acid,SFA)生成单不饱和脂肪酸(monounsaturated fatty acid,MUFA)的关键酶,与乳腺癌的进展和预后密切相关,为乳腺癌潜在的治疗靶点。现有的SCD-1抑
纺织品是日常使用及消耗较多的日用品之一,每年都有大量的纺织品被消耗。存在缺陷的纺织品,其价格和使用体验都会受到较大的影响。目前,国内纺织品缺陷检测主要是由人工完成,然而人工检测存在测速度慢、可靠性低和易受主观因素影响等问题。基于机器视觉的缺陷检测方法恰好能有效解决这些问题,故本文针对基于机器视觉的网孔织物缺陷检测系统进行了研究,主要研究内容包含:(1)网孔织物缺陷检测系统搭建。为了保证检测系统采集
目的:放射治疗(Radiotherapy,RT)是癌症的主要治疗方法之一,在肝细胞癌(hepatocellular carcinoma,HCC)的治疗中具有重要地位。有研究发现,亚致死剂量照射可以促进后代存活肿瘤细胞的侵袭和转移,其机理可能与肿瘤微环境密切相关。因此,我们研究了亚致死剂量照射后HCC中肝非实质细胞(non-parenchyma cells,NPCs)对HCC细胞转移能力的影响及其机
甲状腺未分化癌(Anaplastic thyroid carcinoma,ATC)是甲状腺癌中恶性程度最高的病理亚型,因其抵抗凋亡和DNA损伤,导致化疗药物对ATC患者无效。同时,由于在发展过程中的逐步失分化,ATC细胞中碘代谢基因发生异常甲基化而表达降低,几乎完全丧失了摄取放射性碘的能力,导致ATC患者对放疗不敏感。在基础和临床研究中,诱导肿瘤细胞发生死亡和重分化是治疗ATC的重要机制。食物成分
高性能、低功耗、高可靠已成为微处理器的发展趋势。一方面,高性能始终是微处理器设计的主要研究方向;另一方面,低功耗和高可靠设计方法会对微处理器造成一定的性能损失,如何以更少的时序代价实现低功耗和高可靠设计,也成为了微处理设计中的关键问题。近年来,开源免费的RISC-V指令集受到了学界和业界的广泛关注。研究面向RISC-V微处理器的性能优化方法,具有重要的工程实践意义。本文以基于RISC-V指令集的R
背景:结直肠癌(CRC)是人类常见的消化道恶性肿瘤,每年都有较高的发病率和病死率,特别是在中国,随着人民生活水平的提高,饮食结构发生了重大变化,CRC的发病率呈逐年上升趋势,严重损害患者的健康与生命。共刺激分子B7-H3是免疫检查点蛋白之一,在多种肿瘤类型组织中广泛过表达,与患者不良预后相关。吡咯-5-羧酸还原酶1(PYCR1)是一种线粒体酶,也是参与脯氨酸合成的关键酶,研究显示其在CRC患者组织
高脂饮食是前列腺癌发展的重要危险因素。棕榈酸是膳食脂肪酸中最常见的饱和脂肪酸,也是脂肪酸合成酶(Fatty acid synthase,FASN)的主要终产物。已有许多研究表明,FASN在多种癌症中呈高表达,而FASN表达水平的增高会导致体内合成脂肪酸增多。有研究报道称,肿瘤细胞的增殖依赖于内源性的脂肪酸合成。然而,富含棕榈酸饮食对前列腺癌发生发展的影响少有报道。因此,本文旨在研究富含棕榈酸饮食在
计算机视觉是计算机领域研究的重要分支,一直以来倍受学者、专家关注。其中机器视觉中的单目标跟踪方向,由于其在实际生活中被广泛应用,一直以来成为被研究的热点。目标跟踪任务因其跟踪的目标本身的不确定性以及其跟踪环境的复杂性,会面对诸如目标遮挡、尺寸变化、运动模糊以及长时间跟踪等问题。因其应用场景的复杂性,这就要求跟踪算法有较强的环境适应能力,即良好的鲁棒性。本文针对目标跟踪面对的难题,提出一系列的解决方