【摘 要】
:
语音情感识别是人机交互技术的重要技术之一,同时也是语音信息处理领域的热门研究之一,在医疗、教育等领域有着非常广泛的应用前景。虽然近几年来深度学习给语音情感识别领域
论文部分内容阅读
语音情感识别是人机交互技术的重要技术之一,同时也是语音信息处理领域的热门研究之一,在医疗、教育等领域有着非常广泛的应用前景。虽然近几年来深度学习给语音情感识别领域带来了突破性进展,但是如何有效地提取情绪特征、缓解数据不平衡和域适应问题仍然是语音情感识别研究的关键技术问题。因此针对这些关键问题,基于深度学习技术,本文对语音情感识别算法进行研究。本文的主要研究工作如下:(1)针对如何从冗长的语谱图中有效地提取出情绪特征,本文提出了基于时空-频率注意力的语音情感识别算法。作为一种轻量级的注意力机制,时空-频率注意力由时空注意力和频率注意力级联组成。时空注意力通过通道注意力和空间注意力突出语音信息区域,频率注意力通过频率权重和通道权重捕获与情绪相关的频率组合特征。时空注意力与频率注意力相互配合,辅助神经网络从一段冗长的音频中提取到有效的情绪特征。在IEMOCAP等四个公开数据集上的实验表明,本文算法在加权准确度和未加权准确度上取得了一定的提升,并优于最新方法和具有影响力的方法。(2)针对数据不平衡问题和多个数据库合并后的域适应问题,本文提出了基于中心迁移的语音情感识别算法。针对源数据库的数据不平衡问题,本文合并辅助数据库和源数据库,使得源数据库的弱势类别数据比例提高。针对两域数据合并后出现的域适应问题,本文提出了基于中心迁移的语音情感识别算法。它通过域对抗网络降低两域数据的特征分布差异,同时中心迁移网络约束辅助域特征分布中心向源域中心迁移,保证合并后的训练数据与源域的测试数据的特征分布一致,使得辅助域数据能够缓解源域的数据不平衡问题。在IEMOCAP数据集上的多类别分析实验表明,本文算法在一定程度上提升各弱势类别的准确率并优于变长模型,验证了本文算法在缓解数据不平衡上的有效性。通过在多个公开数据集上进行的定量分析、定性分析、模块化有效性分析、可视化分析实验,验证了本文提出的时空-频率注意力和中心迁移网络的有效性。
其他文献
心脏病作为我国居民身体健康的头号杀手,受到我国居民的广泛关注。人们为了追求健康,对于医疗系统提出了越来越多的要求,这就对医生的工作效率提出了新的要求。而目前的医生
在技术更新加快、市场化竞争加剧的当代,领导者的作用空前强大,但领导者一人的能力未必足够应对这种场景,可能还需要来自企业员工的建议或意见,因此员工建言和员工沉默行为分
针对日益严重的水资源问题以及大负载下的最大功率捕获问题提出了风力海水淡化系统,风力海水淡化系统包括风能捕获模块、驱动模块跟海水淡化模块。垂直轴风力发电机被固定在
目的:探讨冠心病(Coronary heart disease,CHD)病人血清白介素-6(InterIeukin-6,IL-6)、组织金属蛋白酶抑制剂-1(Tissue inhibitor of metalloprotease-1,TIMP-1)水平与冠状动脉粥样硬化性心脏病中冠状动脉粥样硬化斑块稳定性及中医寒热辨证的关系。从而进一步揭示炎症反应与冠状动脉粥样硬化斑块稳定性、中医寒热辨证的关系,
生脉注射液是以生脉散(含红参、麦冬、五味子)为源,经现代工艺制成的一种中药静脉注射剂,广泛应用于心源性休克、心肌梗死、感染性休克等症状。本文以现行生脉注射液质量标准为基,从初步纯化、超滤、抗氧化三个方向进行研究,完善并优化各个工艺参数,为今后生产工艺的控制和改进提供了参考。在纯化工艺方面,在原有生脉注射液纯化工艺的基础上,考察了红参、麦冬、五味子经水提或醇提之后,应用正交设计筛选了不同浓缩倍量和在
人脸识别作为目前学术界和工业界研究的热点问题,已经被广泛应用于智能安防、金融安全、移动支付等多个领域。然而伴随着业务范围的迅速扩大,人脸信息库中的身份数量也快速增
随着人们环保意识的提高和能源危机感的加重,世界各国相继制定一系列的可再生能源发展规划,其中风能具有污染小、开采成本低以及易维护等优点成为各国的首要选择。世界各国对
随着信息科技的不断发展,利用深度神经网络处理大量数据成为主流。但是随着网络精度的提高,网络参数在不断增长,实时处理数据的难度日益增大,因此降低网络复杂度和提高硬件运
近年来海上风力发电在全球蓬勃发展,成为海上风能最具应用前景的形式之一,已受到国家的高度重视,国家能源局《可再生能源“十三五规划”》对海上风电的发展也提出了具体的规
国家形象宣传片是国家形象的重要表达方式之一。随着互联网的发展,网络成为了中国国家形象宣传片的主要发布渠道。自从2011年第一部官方制作的国家形象宣传片播出以来,不断地