基于卷积神经网络的微表情检测与识别技术研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:wgguihuake
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
微表情是一种持续时间短、运动幅度小和非自愿的面部表情,通常发生在一个人故意或不自觉地隐藏他或她的真实情感时,这为揭示人们的真实心理或情绪提供了理论依据。因为微表情可以揭示人们真正的心理状态,已成为人类情感和情感现象理解的重要课题,被心理学、社会学、神经科学、计算机视觉等各个学科所探索。这些技能对心理治疗师、面试官和任何从事沟通工作的人都具有实际应用意义。在刑侦审判、安全防护、心理咨询等领域有重要的应用。随着计算机视觉技术的飞速发展,微表情检测和识别技术也层出不穷,越来越多的技术应用到微表情检测和识别中去,但是大部分检测和识别算法仍存在不足之处。起始结束帧的检测方法常常使用微表情序列的最大时长作为滑窗的大小,或者通过定位高潮帧,之后取高潮帧前后一定间隔作为起始帧和结束帧,固定了微表情的时长;且将微表情检测看成是分类任务,不能反映候选滑窗属于微表情片段的程度大小,导致起始帧结束帧预测不准确。微表情识别的最大困难在于数据库的样本数量有限以及样本之间的细微差异,使得识别率无法进一步提升。为了解决上述问题,本文借助BERT网络和三维卷积神经网络学习微表情序列更细微的特征,借助分组算法更加准确的定位微表情的起始帧和结束帧。借助对比学习的思想,学习不同模态的共享信息,使得在有限的数据样本情况下,学习到更强的特征表达。具体而言,主要贡献如下:●提出了基于BERT网络的微表情检测算法。该算法主要包括三部分:候选片段产生模块、时空特征提取模块和分组模块。具体而言,利用候选片段产生模块,将微表情序列划分为若干个小尺寸微表情候选片段;为了学习微表情片段中的细微特征,时空特征提取模块将候选片段分成不同的时隙,利用三维卷积神经网络学习时隙内的特征,利用BERT网络学习时隙间的特征;同时,为了准确刻画候选片段属于微表情片段的程度大小,采用了回归损失优化模型;为了准确地定位微表情的起始帧结束帧位置,使用了分组算法对连续的候选片段进行合并,并对重叠的片段进行抑制。在CASMEⅡ和SDUspotting数据上进行了大量的实验,结果表明,本方法具有更高的检测准确率。●提出了基于双模态对比学习的微表情识别网络。该网络主要包括三个模块:双模态特征提模块、双模态对比学习融合模态和分类识别模块。具体而言,因为数据库样本数量有限,而样本不仅包含情绪类别的特征,还包含样本之间的通用特征。所以首先将微表情序列分成RGB序列和光流序列;之后利用对比学习构建RGB序列和光流序列之间的对比学习损失,使得网络可以学习到两种模态的通用特征;为了学习到微表情的类别信息,本文将模态特征进行融合,并利用标签数据优化模型。保证网络在通过对比学习学习到两种模态之间的共享信息的同时,又能通过监督学习学习到不同类别的特征。此方法在CASME Ⅱ、SAMM和MMEW上进行了广泛的实验,验证了所提算法的有效性。
其他文献
随着5G技术的推广,物联网技术逐渐成熟,出现了大批传统行业与物联网相结合的新兴行业,例如精准农业、智慧工厂、智慧城市等,其中精准农业是未来农业发展的新潮流。在国内,农村地区的通讯和环境条件相对落后,物联网网络资费、设备成本居高不下,物联网和农村农业结合进展较为缓慢。农业温室大棚是农民种植花卉、水果、反季蔬菜的主要生产设施,拥有相对较为稳定的生产环境,种植作物的收入高。本文以农业温室大棚为背景,设计
对“正确”和“善”的理想追求使人类不断对自身行为加以审查,这种审查作为哲学的一部分,亦被称为伦理。本文将博物馆伦理置于广泛意义范围加以界定,博物馆和展览需要在日常活动中保证其行为符合相关的法规指导和道德规范的约束,并且服务于与博物馆相关的所有人的公共利益,展现出对物件、观众、工作人员强烈的责任感,以提升自身公信力,促进博物馆自身乃至社会的长远发展。博物馆需要把研究展览伦理列入其工作内容。博物馆展览
随着我国国民经济的高速发展和大众层面消费水平的提升,游艇产业作为中高端休闲娱乐产业的代表开始在我国得到较快的发展,海南岛拥有丰富的海岸线资源和良好的地理环境优势,具备发展游艇产业的天然优势,尤其是在海南国际旅游岛建设上升为国家战略后,海南游艇产业得到了快速的发展,吸引了一大批游艇企业和产业资本落户海南。但是在短暂的辉煌过后,近几年来海南游艇产业却呈现出后劲不足、发展缓慢的情况,为了扭转海南游艇产业
社区矫正制度是国家治理体系的重要组成部分,既是顺应国际化的趋势,也是为贯彻落实我国宽严相济的刑事政策而进行的一项刑罚执行制度改革。快速准确的对矫正人员信息分析的需求增加了社区矫正工作人员的压力,如何实现对矫正人员数据的自动的精准分析非常重要。当前矫正人员信息存在的数据量大、隐匿性强的特点。传统的社区矫正模式采取司法人员人工进行制定矫正策略的方式,存在社区矫正力量不足、矫正水平不一致等问题。为解决各
轴对称图形在生活中非常常见,对它的认识主要是了解它的特征,通过孩子动手实践剪一剪和独立思考寻找生活中的轴对称图形,进一步熟悉轴对称图形。
9月6日,国网张家口崇礼区供电公司组织专业人员到冬奥核心区非场馆涉奥重要保电用户开展送电前安全体检,全面排查配电室高压柜、电缆出进线、变压器等设备安全隐患,并完善"一户一档",护航企业绿色用能。该用户将于10月底完成绿电交易。2007年以来,国网张家口供电公司勇立绿色发展潮头,自觉承担起节能降碳的责任,率先在全国开展绿电市场交易。在此基础上,
期刊
随着人工智能技术的发展,声纳感知为诸如自动驾驶、智能机器人等人工智能应用提供越来越多的感知信息,利用超声波对三维空间中的目标进行定位作为声呐感知系统的一个重要研究方向,其重要性日益凸显。研究表明,蝙蝠能够利用自身特殊的发声结构、耳廓结构组成一个超声波目标定位系统,在定位精度、定位灵敏度等方面的表现远远超过当前的人工声呐系统。但是今天,关于仿蝙蝠耳目标定位的研究依旧较少,其中尤以对目标方向角度(俯仰
庚子赔款,由两部分构成,一是《辛丑条约》中议定的4.5亿两白银,时人称为“大赔款”,二是由各省自行赔付当地教会、教民的地方赔款。随着庚子赔款在直隶的筹付,清廷中央、直隶官绅、百姓作出了不同反应,其中的冲突、矛盾与折中、调适,折射出历史本身的复杂与多样。义和团运动在直隶达到了高潮,教案数量众多,这导致直隶教案赔款数额相当巨大。直隶地方赔款筹付带有明显地区特征,地方赔款初期议结时,直隶大部分地区被联军
脑胶质瘤是能产生严重后果的原发性脑部肿瘤之一,它是由于大脑和脊髓胶质细胞非正常增生所引起的,具有患病人数多、复发率高以及较难治愈的特点,若早发现早介入,可以明显提高患者的生存质量。磁共振成像是一种广泛应用的脑胶质瘤诊断技术,从磁共振影像数据中分割出脑胶质瘤不同的病理区域是众多医学治疗过程的前提,但是由于磁共振影像数据量大,医生或者放射科大夫无法在短时间内对影像进行人工分割,且已分割部分无法做到很高