基于语音与文本融合的说话人情感状态识别

来源 :长沙理工大学 | 被引量 : 0次 | 上传用户:hasolao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
情感识别是一项具有挑战性的任务,因为人的情感表达方式是微妙而且复杂的。近年来人类在情感识别方面取得了较大的进步,但是依然无法与机器进行自然的互动。对于许多人机交互的应用而言,构建一个能够理解人的情感系统至关重要。研究学者为了对人类情感进行识别,通常的做法是从音频信号等单一信号中提取与情感相关的特征,然后利用特征训练分类器。但单模态情感识别往往存在识别率低,鲁棒性差等特点,因此,提高情感识别的准确率成为了一个亟待解决的问题。本文主要融合语音与文本两个模态的特征信息,并在此基础上进行双模态情感识别的研究,针对双模态情感识别模型在情感特征提取以及分类器模型上进行改进和探索。本论文的主要研究内容为:1.研究适用于不同模态上的基于深度学习的特征提取以及情感识别模型。对于音频模态,提出了一种音频循环编码器模型,采用开源工具pyAudioAnalysis来提取语音信号中的基础特征,采用短时傅里叶变化提取语谱图中频域特征,将基础特征与频域特征的特征向量采用直接融合方式得到最后的语音特征,使用卷积神经网络与双向长短期记忆神经网络的融合对特征学习,并进行情感识别,通过对比实验,验证语谱图中频域特征对情感识别正确率确实有所提升;对于文本模态,提出了一种文本循环编码器模型,主要采用自然语言工具包NLTK对文本进行分词处理,模型中采用双向长短期记忆神经网络进行文本情感特征的提取,使得模型能够合理利用文本的上下文语义及语序信息;对于语音和文本混合的特征,提出了一种双模态循环编码器模型,使用直接级联的特征融合方式对上述两种模型分别提取得到的语音和文本特征进行融合,然后在经过全连接层,对情感进行高兴、生气、悲伤和中性四种类别的分类。2.研究双模态特征的融合方式。针对双模态特征融合采用直接级联方式存在的缺点进行模型的改进,提出了融合注意力机制双模态情感识别模型,该机制检测单个模态的特征向量中与情感信号的相关性并根据相关性分配权重。使系统聚焦于与情感相关的语音帧和文本向量上,使两种融合得到的特征更加有效,进而提高识别效率。同时为了验证双向长短期记忆神经网络层中间节点的信息对模型性能提升的影响,笔者增加了融合统计池化的模型结构,实验结果表明增加双向长短期记忆神经网络层中间节点的信息确实有一定的性能提升,但相对于注意力机制而言,其性能提升并不十分明显。
其他文献
曹文轩以对中国古典诗性文学流脉的自觉承继,打造出与中国当代文学主流保持着某种距离的文学风景。其作品以对自然的崇尚,对文学美感和情感价值的重视,对恒定悠长的温暖与感动的寻求,完成对复杂纷乱生命情绪的记录,构成了当代文坛别致的美学景观。古典之美的肌理呈现着曹文轩作品雅致的诗意,在诗意的地表下,作者潜入现代意识,一方面在对荒原意识的体认中探究着人类恒在的孤独困境,同时试图为客观存在的隔膜寻求处方。另一方
薪酬管理在企业管理模块中处于最为核心的关键性位置,与员工个人利益和企业效益息息相关,这就要求企业在生存发展的同时也要意识到向人力资源要生产力。对于大部分中小企业而言,成立时间较短,鉴于资源、视野等条件的限制,管理增效益的观念一直较为淡化,特别是对薪酬管理的重视程度不够,如何引导管理层和人力资源部门将薪酬管理工作从“忽视”转向“重视”,由“感性认知”转向“规范合理”,则显得至关重要。本文以节能科技型
瓜环(Cucurbit[n]uril,CB[n],n=5-8,10),又称葫芦脲,是继冠醚、环糊精、杯芳烃之后近年来发展最为迅速的一类大环化合物。CB[n]s具有负电性的羰基端口和疏水性空腔,能与金属离子、有机小分子、生物分子等发生主客体识别作用,因而被广泛应用于环境、食品、生物、免疫等领域。目前CB[n]s修饰电极已成功应用于电化学领域,但在电致化学发光中的应用尚未有报道。因此本论文研究了CB[
随着全球工业化和城市化进程的不断加快,水资源污染问题日益突出。其中重金属和抗生素类污染物的有效控制已经成为亟待解决的重要问题。与传统技术相比,光催化技术具有能耗低、去除率高及无二次污染等优点,被认为是最具发展潜力的污水净化技术之一,但由于存在太阳光利用率低等问题,限制了其广泛应用。针对这一科学问题,本文以比表面积大、结构与功能易调控的金属-有机框架(MOFs)材料为主体,构建了Ag/NH_2-MI
中国-东盟博览会与中国-东盟投资峰会是中国和东盟国家领导人共同确定举办的国际经贸盛会。自2004年起,该盛会每年在中国广西南宁举办。随着中国-东盟自由贸易区和中国“一带一路”发展策略的不断发展,东博会的规模与关注度也在不断提高。为了更好地介绍和宣传该项盛事,每年都有中外媒体记者受邀来到南宁对东博会进行报道。负责接待和服务受邀媒体工作者的中国-东盟博览会秘书处会在博览会期间举行中外合作媒体交流会,与
在我国,受客观条件限制,部分城市不得不采用高硬度地下水作为供水水源,高效、低耗、操作简单的硬度去除技术研发应用,是饮水安全保障的主要任务。传统结晶软化法因成本低廉、技术成熟、软化效率高,得到广泛应用,但存在结晶产物细碎、沉降性能差,出水浊度高等问题,且pH值偏高,需进行酸回调。为此,本研究以四氧化三铁颗粒为诱导剂,开展诱导结晶与混凝联用的软化技术研究,考察诱导结晶对钙硬度的去除效能,以及混凝对出水
随着市场经济的发展,我国的债券市场也在不断发展,但在债券市场发展的进程中,产生了一些问题,其中,重要的问题之一就是债券违约的现象越来越多。2015年以来,我国开始进行“供给侧”改革,在这样的背景下,防范控制金融市场上的金融杠杆风险是重要的目标之一。2019年,债券市场中的整体违约情况较2018年来看更加严重。探究债券违约发生的原因,找寻针对债券违约风险防范的对策对于企业的持续经营和金融市场的健康发
当今世界经济局势下,我国制造业出口产品在国际市场上逐渐丧失竞争力,为了重塑我国制造业企业在全球价值链的地位和竞争力,相关学者把研究重点从制造业出口规模和出口数量转移到提升出口产品质量方面。在我国制造业服务化相关政策的指导下,加速制造业和服务业二者的融合,强化制造业中服务业的嵌入度已经成为重要的研究课题。论文梳理了制造业服务化与出口产品质量的相关文献,运用一般均衡分析并通过成本效应和分工效应阐释了制
随着互联网的普及和消费者理念的转变,保险行业原有的人海模式弊端凸显,转型升级迫在眉睫。变革的关键在于人,因此,构建稳定性代理人队伍,进而提升代理人质量显得尤为重要。基于此,本文聚焦于A保险公司,通过文献分析法、问卷调查法和访谈法探究其留存管理存在问题,并结合分析为建设稳定性代理人队伍提出对策,以期为其健康发展提供借鉴。本文认为影响A保险公司代理人团队稳定性因素的原因是其培训体系、薪酬体系、绩效体系
事件检测算法通过对海量文本进行内容提取、文本表示和聚类检测事件,能够快速准确地将事件的相关资讯展示给用户,并为政府和企业提供有效的决策支持信息。气象事件检测根据气