论文部分内容阅读
语音是人类交流和认识世界的最重要方式之一,其中蕴含的信息仅次于视觉。随着人工智能的高速发展,人机交互成为当下研究的热点之一,让机器具备识别和表达情感的能力成为研究者的目标,语音情感分析的重要性日益突出。
在语音情感分析领域,目前常见研究是研究定长的语音情感分析,专门研究变长的语音情感分析的很少,由于语音信号本身长度具有可变性,本文主要研究变长语音信号的语音情感分析。在现实生活中,语音信号的长度基本都是变长的,因此本文的研究具有一定的理论意义和应用前景。
在语音信号的特征提取方面,本文研究常见特征:谱特征、韵律特征、声音质量特征。目前大多数研究者采用的是多种特征结合的方式,即融合特征进行实验研究。由于MFCC能有效反应人耳的听觉特性,本文提取的特征是常用的谱特征中的MFCC特征。
本文的主要工作如下:
(1)研究了语音情感分析的研究背景和意义,归纳了语音情感分析的研究历史和现状,总结了变长序列的语音情感的分析研究现状。
(2)对变长序列的语音情感分析提出了两种处理方法,并对方法进行分析,分析其对谱特征、部分韵律特征的影响。
(3)设计BP神经网络模型,结合本文提出的变长序列的语音情感分析方法处理语音序列,提取处理后的语音序列的MFCC特征的统计特征作为特征向量,进行语音情感分析。
(4)设计卷积神经网络模型,结合本文提出的变长序列的语音情感分析方法处理语音序列,提取处理后的语音序列的MFCC特征,并将MFCC特征的维度调整到指定大小,针对小样本问题,本文结合语音信号的特性对调整后的MFCC特征进行数据增强,然后进行语音情感分析。
最后,本文对实验结果进行分析,并与相关研究结果进行比较,得出结论,证明本文提出的变长语音信号处理方法具有一定的参考性。
在语音情感分析领域,目前常见研究是研究定长的语音情感分析,专门研究变长的语音情感分析的很少,由于语音信号本身长度具有可变性,本文主要研究变长语音信号的语音情感分析。在现实生活中,语音信号的长度基本都是变长的,因此本文的研究具有一定的理论意义和应用前景。
在语音信号的特征提取方面,本文研究常见特征:谱特征、韵律特征、声音质量特征。目前大多数研究者采用的是多种特征结合的方式,即融合特征进行实验研究。由于MFCC能有效反应人耳的听觉特性,本文提取的特征是常用的谱特征中的MFCC特征。
本文的主要工作如下:
(1)研究了语音情感分析的研究背景和意义,归纳了语音情感分析的研究历史和现状,总结了变长序列的语音情感的分析研究现状。
(2)对变长序列的语音情感分析提出了两种处理方法,并对方法进行分析,分析其对谱特征、部分韵律特征的影响。
(3)设计BP神经网络模型,结合本文提出的变长序列的语音情感分析方法处理语音序列,提取处理后的语音序列的MFCC特征的统计特征作为特征向量,进行语音情感分析。
(4)设计卷积神经网络模型,结合本文提出的变长序列的语音情感分析方法处理语音序列,提取处理后的语音序列的MFCC特征,并将MFCC特征的维度调整到指定大小,针对小样本问题,本文结合语音信号的特性对调整后的MFCC特征进行数据增强,然后进行语音情感分析。
最后,本文对实验结果进行分析,并与相关研究结果进行比较,得出结论,证明本文提出的变长语音信号处理方法具有一定的参考性。