基于神经网络的变长语音情感分析研究

来源 :西华大学 | 被引量 : 0次 | 上传用户:zhuyanyan09eight
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音是人类交流和认识世界的最重要方式之一,其中蕴含的信息仅次于视觉。随着人工智能的高速发展,人机交互成为当下研究的热点之一,让机器具备识别和表达情感的能力成为研究者的目标,语音情感分析的重要性日益突出。
  在语音情感分析领域,目前常见研究是研究定长的语音情感分析,专门研究变长的语音情感分析的很少,由于语音信号本身长度具有可变性,本文主要研究变长语音信号的语音情感分析。在现实生活中,语音信号的长度基本都是变长的,因此本文的研究具有一定的理论意义和应用前景。
  在语音信号的特征提取方面,本文研究常见特征:谱特征、韵律特征、声音质量特征。目前大多数研究者采用的是多种特征结合的方式,即融合特征进行实验研究。由于MFCC能有效反应人耳的听觉特性,本文提取的特征是常用的谱特征中的MFCC特征。
  本文的主要工作如下:
  (1)研究了语音情感分析的研究背景和意义,归纳了语音情感分析的研究历史和现状,总结了变长序列的语音情感的分析研究现状。
  (2)对变长序列的语音情感分析提出了两种处理方法,并对方法进行分析,分析其对谱特征、部分韵律特征的影响。
  (3)设计BP神经网络模型,结合本文提出的变长序列的语音情感分析方法处理语音序列,提取处理后的语音序列的MFCC特征的统计特征作为特征向量,进行语音情感分析。
  (4)设计卷积神经网络模型,结合本文提出的变长序列的语音情感分析方法处理语音序列,提取处理后的语音序列的MFCC特征,并将MFCC特征的维度调整到指定大小,针对小样本问题,本文结合语音信号的特性对调整后的MFCC特征进行数据增强,然后进行语音情感分析。
  最后,本文对实验结果进行分析,并与相关研究结果进行比较,得出结论,证明本文提出的变长语音信号处理方法具有一定的参考性。
其他文献
行为检测是从包含大量背景信息的多媒体视频中检测出包含人的动作行为的视频片段的起止时间,并对视频片段进行分类的计算机视觉任务。在智能视频监控、视频自动审核、自动驾驶方面有重要应用价值。大数据时代的到来,使以视频为代表的多媒体信息出现爆炸性增长,行为检测的重要性愈加凸显。然而真实的多媒体视频包含复杂的场景信息,加上人的行为复杂多样,设计出鲁棒的、可迁移的、精度高的行为检测算法依然困难重重。  针对行为
学位
指法是钢琴演奏中最基本最重要的技术之一,但目前大量乐谱上都缺失指法信息,这对专业演奏家及业余演奏爱好者来说,都是演奏时遇到的首要问题,因此钢琴等键盘类乐器的指法自动标注方法研究具有重要的理论和应用价值。  现有的一阶隐马尔可夫模型(Hidden Markov Model, HMM)若直接用于钢琴指法标注,因其不能结合音符序列的长程信息,将导致标注结果存在物理不可弹指法,演奏效率较低。因此本文中提出
学位
从视频中分离运动物体和背景是视频分析领域中一个重要而又充满挑战性的任务,具有广泛的应用前景。但是,由于视频常常受到恶劣天气、相机抖动、光照条件变化和动态背景等因素的影响,现阶段存在的方法常常面临着准确性不足的问题。为此,本文以视频前背景分离任务为出发点,分别围绕传统方法和深度学习方法进行展开。论文的主要工作和创新点如下:  1.提出了一个基于时空可扩展矩阵恢复的视频前背景分离方法(SSMR),该方
在当今的信息大爆炸时代,全世界在近两年内产生的信息量比过去五年的信息总量还多,数字信息正以惊人的速度增长积累。现阶段人们使用的存储设备,如磁盘、半导体等逐渐暴露出先天不足,寻找新一代的可替代存储技术刻不容缓。  脱氧核糖核酸(Deoxyribonucleic Acid, DNA)是一种天然的信息载体,它具有容量大、寿命长、能耗低等先天优势。随着DNA合成及测序技术的快速发展,研究人员把新一代数据存
学位
水声传感器网络(UASNs)具有长传输延时、窄带宽、节点资源受限、频繁连接中断等特点,被看作延迟/中断容忍网络(DTNs),因此可以将DTN协议引入UASNs解决上述问题。但是,传统的针对陆地通信的DTN协议应用于水下会增加网络延时,且无法解决节点资源受限的问题,这使得水声通信的传输效率低,能耗大,网络寿命短。在此背景下,本文提出了一种基于DTN网络协议架构的水声传感器网络跨层协议新机制,将网络层
工业窑炉作为复杂难控类工业对象,一直是控制界关注与探索的课题之一.该文以玻璃窑炉为研究对象,给出一套完整的智能控制策略.基于实际控制操作中调整控制增益的思想,提出一种鲁棒自校正模糊控制器,并针对两种不同对象进行了仿真研究,验证其性能指标优于传统模糊控制器,在分析窑炉特性的基础上,以温度系统为例,根据其被 控参数多、大滞后、非线性等特点,提出分层分区的智能控制策略:上层采用模糊监督控制器,为下层提
学位
该文作者对多媒体监控系统作了较为全面系统的介绍.进行了工业过程多媒体监控系统的设计,将静态图像锁定、报警及图像处理技术与监控技术相结合,对工业过程多媒体监控软件包进行设计、软件编程,并进行软件包的调试、功能测试,结果表明本软件包是有效的.
学位
微等离子体不仅具有传统等离子体的主要特性,通常还具有体积小、功耗低、温度低、电子密度/温度高、可大气压下操作等诸多优点,因此在光谱分析中受到关注,并被广泛用作其原子化器与激发源、或相关样品处理~([1,2])。尖端放电是一类常用的放电微等离子体技术,其结构简单、易于驱动,更有利于实现光谱分析仪器的小型化(图1)。然而也存在激发能力较弱、易受传统进样方式引入的样品水分与基体的影响等~([3,4])。
系统仿真是分析、研究和设计各种复杂系统的有力工具.仿真系统分为两大类:连续系统和离散事件系统.该文以一个面向连续系统的计算机实时仿真系统的实现为背景,从系统的实用性出发,详细讨论该仿真系统的硬件设计与软件开发.
学位
背景和目的:ω-3系脂肪酸尤其是DHA在孕期营养的重要性越来越受到关注,但关于ω-3系脂肪酸与妊娠结局研究不多。方法:在墨西哥库埃纳瓦卡市进行了一项双盲、随机、对照研究来评价孕期DHA的补充是否影响母亲怀孕时间及婴儿出生状况。1094名18~35岁的孕妇随机分为两组,从孕