论文部分内容阅读
近年来,随着人们对人机交互要求的不断提高,情感计算随之成为热点的研究问题。因为语音是人类交流最常用、最基本手段,并且语音信号在传达语义信息的同时,还传递着情感信息,因此,语音情感识别作为情感计算的一个分支正越来越受到人们的重视。随着各学科技术的发展,语音情感识别已经取得了长足进步,但由于人类情感的复杂性,对情感的定义与分类至今没有一个统一的认识,而且与情感语音数据库、语音情感特征参数和语音情感识别方法等相关的理论框架并不成熟,使得语音情感识别的研究还属于初步阶段,有许多需要深入研究的地方。本文首先介绍了语音情感识别的现状和其在实际生活中的应用,并对语音情感识别所面对的问题进行了总结。根据不同学科、不同角度的研究,简述了对情感的定义和分类,并把本文研究的情感归为4类。参考情感语音数据库的获取方法,用剪辑法和录音法建立了一个小型情感语音数据库。在此基础之上,对语音的声学特征进行了分析,并提取出与时间、振幅能量、基频和Mel倒谱系数相关的9个语音情感特征参数。语音情感识别本质上是一个模式识别问题,支持向量机在众多分类器中表现出强大的分类性能,条件随机场是在最大熵马尔科夫模型基础上发展出来的用于序列标记和分割的模型,它没有隐马尔科夫模型严格的条件假设,基于上述原因本文选择这两种分类器与4类情感特征构成子分类器,并对识别结果使用决策模板法进行融合。通过和上述两种分类器单独分类的结果进行对比实验表明,本文所采用方法的识别率取得了明显的提高,得到了比较满意的识别结果。