基于SVM-CRF多分类器融合的语音情感识别研究

来源 :天津师范大学 | 被引量 : 4次 | 上传用户:dfg4g4354yh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着人们对人机交互要求的不断提高,情感计算随之成为热点的研究问题。因为语音是人类交流最常用、最基本手段,并且语音信号在传达语义信息的同时,还传递着情感信息,因此,语音情感识别作为情感计算的一个分支正越来越受到人们的重视。随着各学科技术的发展,语音情感识别已经取得了长足进步,但由于人类情感的复杂性,对情感的定义与分类至今没有一个统一的认识,而且与情感语音数据库、语音情感特征参数和语音情感识别方法等相关的理论框架并不成熟,使得语音情感识别的研究还属于初步阶段,有许多需要深入研究的地方。本文首先介绍了语音情感识别的现状和其在实际生活中的应用,并对语音情感识别所面对的问题进行了总结。根据不同学科、不同角度的研究,简述了对情感的定义和分类,并把本文研究的情感归为4类。参考情感语音数据库的获取方法,用剪辑法和录音法建立了一个小型情感语音数据库。在此基础之上,对语音的声学特征进行了分析,并提取出与时间、振幅能量、基频和Mel倒谱系数相关的9个语音情感特征参数。语音情感识别本质上是一个模式识别问题,支持向量机在众多分类器中表现出强大的分类性能,条件随机场是在最大熵马尔科夫模型基础上发展出来的用于序列标记和分割的模型,它没有隐马尔科夫模型严格的条件假设,基于上述原因本文选择这两种分类器与4类情感特征构成子分类器,并对识别结果使用决策模板法进行融合。通过和上述两种分类器单独分类的结果进行对比实验表明,本文所采用方法的识别率取得了明显的提高,得到了比较满意的识别结果。
其他文献
本研究以城市化和产业经济学的相关原理为理论基础,探讨城市化进程中体育产业发展状况。从对部分发达国家城市化进程与体育产业演变的轨迹的考察可知,城市化发展和体育产业发
研究目的:以节奏策略中枢控制器模型为基础,采用“RPE钳”技术对运动强力手段进行再认识再评价,探讨了生理、心理以及营养三种强力手段究竟是通过前馈机制还是通过反馈机制而发
复合词的语义整合一直是心理语言学家们最为关心的问题之一,而名名复合词,尤其是“修饰词+主名词”(modifier+headnoun)这种结构,由于其形式简洁同时又包含复杂的意义构建过程,得到
随着我国硕士研究生学制改革以来,近些年来这个问题一直是人们关注的焦点。随着时代的变迁,硕士研究生学制也经历了几次改革和变迁。然而每次改革的结果都会引发大范围的讨论,有
研究目的:近10年,我国男子跳远项目的运动水平有了很大进步,也取得了较为出色的成绩。男子跳远最好成绩达到8.47m,逐渐靠近世界水平。特别是在2015年北京世界田径锦标赛上,参