基于表情和生理信号的双模态视频情感识别研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:lucky525
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人工智能的不断发展,人们希望计算机在交互的过程中能够理解人类传达的情感,并能够带有情感地与人类自然交流,因此为实现和谐的人机交互,情感识别逐渐成为人机交互研究领域的关键技术之一。本文从人脸表情及面部血容量脉冲生理信号两方面开展视频情感识别研究,旨在充分挖掘人脸视频中的情感信息。本文主要工作和创新点描述如下:(1)针对目前国际上公开视频情感数据库较少的问题,设计了一套完整的情感诱发实验,采集了 30名被试者的情感视频,并对视频进行剪辑等预处理操作,得到可用于情感识别的数据库,该数据库共采集了四种情感,包括高兴、恐惧、悲伤和愤怒。(2)以往视频情感识别方法主要是将视频中的彩色图像转化为灰度图像,然后对灰度化后的人脸图像提取表情特征,很少关注视频中的彩色信息所蕴含的情感因素。此外,常用的生理信号均是在受控环境下通过专门的生理采集仪器获得,均属于接触式,数据的采集过程较为复杂,也容易给被试者带来不适。为了充分挖掘出人脸视频中蕴含的情感信息,提出一种基于人脸面部血容量脉冲(Blood Volume Pulse,BVP)生理信号的视频情感识别方法,该方法中生理信号的获取是一种无接触的方式。首先对视频中的人脸图像进行视频颜色放大,放大视频中微弱的BVP信号,然后对视频提取时域、频域和非线性特征。考虑到表情、眼镜和刘海等因素对生理信号质量的影响,将人脸区域进行分割,对不同区域、不同情感特征进行试验与分析。实验结果证明了所提方法的可行性和有效性。(3)针对单模态在情感表达方面的局限性,提出一种融合表情和BVP生理信号的双模态视频情感识别方法。首先分别提取视频中人脸的LBP-TOP与HOG-TOP特征和BVP生理信号;然后融合LBP-TOP和HOG-TOP特征进行人脸表情识别,接着利用面部BVP生理信号进行情感识别;将两种情感识别结果送入模糊积分融合分类器进行双模态融合情感识别,最后得到融合后的结果。与单模态情感识别的对比结果说明了双模态融合方法的有效性,与其他文献对比的结果表明了本文方法具有一定的优越性。
其他文献
介绍了电力工业化信息的指导思想和电力信息化工程建设的内容,介绍了电力信息化的基础装备现状和重大工程应用现状,展望了新世纪电力信息化的发展前景.
一当代中国文化发展存在着历时性落差的文化精神与文化模式的共时态呈现,存在着诸多的内在冲突与分化.由于经济全球化的深入发展、市场经济的不断推进、电子传媒技术的广泛使
中国改革开放过程中,经济持续快速增长的同时贫富差距加大和基本公共服务供给不足一定程序上制约了社会经济可持续发展,其中城乡收入差距和城乡基本公共服务差距过大备受社会
在现代设计中,唐代的宝相花纹被广泛的应用到了陶瓷、包装以及服饰的设计中,在标志设计中的运用探析相对较少。因此,文章以唐代宝相花纹为主体,通过相关文献的查阅和整理,阐
本文通过新冠肺炎疫情下居家健身潮的兴起为主线而展开的一系列论述,主要以居家健身潮在疫情环境下的发展,以及大众在疫情环境下对身体健康意识觉醒为目的展开论述.居家健身
<正>写话训练是小学低段培养书面表达能力的主要形式。为了提升低段学生的写话水平,练笔是教师平常进行写话训练主要途径,形式多样,组织灵活,内容不拘一格,很好地迎合了小学
企业基层工会女职工组织是企业联系职工群众的桥梁和纽带,肩负着团结、引导、教育、凝聚广大职工的重任,工会女职工组织作用发挥得好坏,在一定程度上关系到职工队伍的稳定,也