论文部分内容阅读
语音情感识别研究是情感计算领域的一个重要组成部分,近年来越来越多的研究者和研究机构都投身于该领域的研究中。传统的基于快速傅里叶变换方法的情感特征提取不得不进行的一个前提操作是对语音片段进行分帧,因为这样才能满足短时傅里叶变换的条件。本文将采用HHT方法应用于语音情感识别研究中,该方法具有处理非线性非平稳性信号的能力,可以将整条语料作为一个整体进行分析,这样就可以从传统方法对语音分帧这一局限中跳出来,对整条语料进行情感特征提取和分析。本文重点完成了以下几个工作:1.利用希尔伯特黄变换方法,基于希尔伯特边际谱实现了一种新的用于语音情感识别的长时特征提取方法,与传统的基于傅里叶变换方法提取的长时特征相比,该长时特征在识别分类短句语料的情感特性方面具有优势,并对影响实验结果的因素给出了详细的分析。2.依据经验模态分解分解结构提出了架构特征提取方案以及依据固有模态分量提出了成分特征提取方案,深入研究了不同情感的语料在相同级数的固有模态分量的差异,并依据这些差异设计并实现了实验方案。3.深入研究了经验模态分解从音频分解出来的固有模态分量对各类情感语音的影响,并且详细分析了同类情感类型条件下来自每阶固有模态分量对识别率的贡献情况,实验结果数据在一定程度上体现了不同情感类型语音的情感信息在各个频带的分布情况,对于揭示情感在语音中的分布表达方式细节具有重要意义。4.针对经验模态分解分解的耗时问题提出了迭代次数限定法和误差阈值法相结合的改进筛选迭代算法,改进的方案大大提高了算法的运行效率。