基于表情、语音和文本的多模态情感分析

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:cngvr
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近些年,随着多媒体社交平台的快速发展,相较于早期以文本数据进行情感分析的研究,融合视频、音频、文本数据的情感分析越来越受到研究人员的关注。多模态情感分析通过引入多个模态的信息,一是克服单模态情感分析存在的误差高,鲁棒性低等缺点,二是能够利用不同模态之间的互补特性提高情感特征的表征能力,从而提升情感分析的能力。人类往往通过多种方式来表达自身的情感,其中,表情、语音和文本是人们平时最常接触的情感表达方式,在多媒体社交平台以多模态数据发展的背景下,本论文研究基于表情、语音和文本的多模态情感分析,对情感特征提取以及多模态特征有效融合展开多模态情感分析的研究,本论文的主要研究内容为:(1)针对以往单模态情感特征表征能力不足的问题,本文采用改进的特征提取方法,对于表情模态主要采用预训练模型以及人脸关键点特征获取表情情感特征;对于语音模态主要采用语谱图以及卷积神经网络来获取语音情感特征,从时间域和频域两个维度来表征语音模态;对于文本模态主要采用预训练的词向量以及句子向量模型来获取文本情感特征,预训练的词向量和句子向量模型通过大规模的数据训练,能够很好的表征文本情感特征。(2)针对直接级联融合情感特征存在的向量维度高、忽略模态间相关性和差异性的问题,提出使用注意力机制来获取多模态重要性语义信息用于情感分析,通过注意力机制学习每个单模态特征对自身影响的重要程度以及不同模态相互之间的重要性程度,获得包含重要性语义信息的多模态情感特征用于情感分析,使用了注意力机制的多模态情感分类准确率达到82.71%,相较于直接级联融合进行情感分析准确率提升了约1%,情感分析能力得到了提升。(3)针对目前大多数研究忽略多模态上下文信息的问题,提出使用图卷积神经网络来获取多模态的上下文信息,通过构建多模态数据的上下文图结构,使用图卷积神经网络将上下文信息映射到多模态情感特征中,获得多模态上下文情感特征用于情感分析,多模态情感分类准确率达到83.28%,结果表明,图卷积神经网络引入的上下文信息使得多模态情感特征更加丰富,情感分析模型鲁棒性更强,能够进一步提升情感分析的能力。
其他文献
据历史文献所载以及民间传说佐证可得知,中国苗族主要分布在中国黔、湘、鄂、川、滇、桂、琼等省份。根据2010年第六次全国人口普查资料显示,全国苗族人口为9426007人,其中海南省苗族人口便有74482人,位居全国有苗族的人口省份第十一位。海南苗族世世代代居住在海南岛上,是海南岛的第二大少数民族,现在主要分布在琼中、琼海、屯昌、万宁、保亭、五指山等地区。本文以海南苗族传统舞蹈为主要研究对象,运用艺术
河口瑶族民间舞蹈历史悠久、源远流长,在其历史发展的长河中,较好的保留了其种类丰富、特色鲜明的舞蹈样貌。随着新时代文艺发展建设的需要,民族民间舞蹈教育体系的完善建立,地方民族民间舞蹈开始逐步在原有基础上谋思路、求发展。因此,在探索河口瑶族民间舞蹈发展的道路上,实践教学组合创作研究对目前发展河口瑶族民间舞蹈实践教学有着实际作用。本文主要围绕河口瑶族传统舞蹈语言重构展开,探索河口瑶族民间舞蹈的历史成因、
当前,互联网技术飞速发展,新兴的应用程序应运而生。随着网络环境的复杂化,互联网服务提供商(ISP)迫切需要对大量的网络视频流进行分类与管理。同时,网络技术的发展,导致以前收集并标记的大量网络流数据集会过时,导致可用的训练集较少,需要实时采集和标注大量的新数据;另外,网络流特征会随着时间和网络环境的变化而发生概念漂移,并且不同应用类别的流发生漂移的情况可能不相同,导致基于传统的机器学习(ML)模型的
足球运动是初中体育教学的重要组成部分,而足球运动体能训练能进一步提高学生的足球技能,提高足球教学实效,促进初中学生身心全面发展。然而,在当前的初中足球体能训练中存在训练方法单一、缺乏趣味性、学生积极性偏低等诸多问题,直接影响着足球体能训练效果,阻碍着校园足球运动的稳定发展。对此,初中体育教师应对初中生足球体能训练中存在的问题有正确的认识,并采取有针对性的措施,让学生明白足球的真谛,学会一种拼搏精神
与传统刚性机器人不同,软体机器人具有高柔软性、高安全性和包裹性好等优点,可以吸收外界干扰产生的力与冲击,不会对交互的环境造成任何损伤。具备优异的运动能力,以及在军事探测、医疗手术、自动化生产线等复杂环境中进行作业的能力,有很大的应用价值。当前的研究多集中于保持软体机器人本身的柔顺性,很少考虑任务中的刚柔可控性,即要求任务中具有满足一定条件的刚度和可控性。虽然软体机器人表现出其他类型机器人无法比拟的
加矾工艺是自来水厂水质净化的重要环节,加矾的主要作用是去除原水中的悬浮杂质、胶体颗粒及附着于胶体颗粒上的细菌病毒等有害物质。依据美国联邦环保局饮用水病毒去除技术指南,当砂滤池出水浊度低于0.3NTU时,病毒去除率为99%。因此新冠病毒疫情期间,加强对加矾工艺运行的有效控制,严格限制沉淀池、砂滤池出水浊度,有利于对病毒的有效去除,能够保障出厂水质安全。目前国内大部分自来水厂的加矾控制仍然采用基于水流
近年来,物联网技术在农业领域的应用日益增加。物联网数据分为常规传感器所采集的结构化数据和摄像头等设备采集的非结构化数据,如何高性能地存储农业物联网异构数据,并以一定的策略保证数据存储的安全性,是当前农业物联网数据管理的关键问题。为了解决物联网异构数据的存储问题,本文提出了一种混合型异构数据存储方案。对于结构化数据,本文基于My SQL分布式数据库结合Redis缓存,设计了结构化数据的存储方案;而对
铜鼓舞是云南省文山州壮族、彝族民众中流传最广、影响最深的古老舞种之一,分布于广南、麻栗坡、富宁、西畴、马关、邱北等县的壮彝村寨。富宁县彝族大部分与壮族、苗族、瑶族、汉族杂居,分布在山间河谷地带,在经历文化融合后,不仅保留了自身山地文化的特征,其农耕文化也呈现出稻作文化的特点,并集中反映在彝族传统铜鼓舞中。除此之外,富宁县境内,分布在不同地区的彝族倮支系村寨在其文化内部,又有不同的文化表征和表现行为
随着雷达、全球定位系统、边缘计算、5G等技术的应用,自动驾驶也正以一种势如破竹的态势在发展。目标检测技术作为自动驾驶技术的核心支撑,通过与这些技术结合,从各种先进的摄像头等监控设备收集当前路况信息,可以快速又准确地获取目标信息和周边交通状况,进一步实现车辆的规划路径行驶、安全驾驶等功能。本文结合最新研究热点和多目标检测难点,对两阶段目标检测网络进行深入研究和改进,从而更好地提高复杂交通场景多目标的
增强现实、面部识别和群智感知等新型应用程序快速发展,不仅产生了庞大的计算需求,在响应延迟和设备能耗等方面也提出了更高的要求。而物联网终端在计算资源、存储能力和电池容量等方面严重受限,无法满足上述需求。边缘计算是该问题的理想解决方案,通过在网络边缘提供低延迟和高带宽的计算环境,利用计算卸载技术将任务迁移到边缘节点进行处理,从而有效减少响应延迟、降低终端能耗。但是在战术物联网中,通信环境较为恶劣,网络