基于HMM与RBF的语音情感识别

来源 :郑州大学 | 被引量 : 0次 | 上传用户:fenglin1985z
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当前,新型智能人机交互技术的研究是计算机科学领域一个十分活跃的课题。模仿和延伸人类的情感使计算机具有识别、理解和表达情感的能力,是智能人机交互非常重要的任务之一。计算机具备了情感能力才能理解语音信号表现的情感,真正做到与人自然的交流。语音情感识别的研究作为智能人机交互的关键技术之一,对增强计算机的智能化、人性化、开发新型人机环境有着重要的现实意义。计算机根据语音自动识别说话人的情感,作出更针对的、人性的响应,能够有效地改善呆板的人机交互服务,提高交互的亲切性和准确性。本文主要是针对单一模型识别情感时的缺陷,建立基于隐马尔科夫模型和人工神经网络的混合模型进行分类。主要进行的研究工作有:(1)分析语音情感库及情感分类现状,确定所需情感类别。按一定规则选定录音情感语句、以及实验设备、录音人员等,录制包含高兴、悲伤、愤怒、惊奇、平静五种情感的汉语情感语音库。(2)针对不同情感的变化规律,分析并提取了能量、基音频率、共振峰等情感特征参数组合成语音情感识别的特征矢量进行情感状态的识别。(3)详细介绍了隐马尔科夫模型和径向基神经网络情感语音识别的原理和方法,结合隐马尔科夫模型对动态序列良好的建模能力和径向基神经网络强大的分类决策能力,建立基于两者的混合模型。混合模型保持HMM的基本框架,在HMM后串联一个RBF网络。同时,混合模型不再采用常用的最佳状态序列,而改用状态累积概率作为径向基神经网络的输入进行分类,避免了特征向量时间规整的麻烦,克服了神经网络只能处理固定输入的缺陷。(4)通过MATLAB实验仿真。结果表明:本文提出的基于隐马尔科夫和径向基神经网络的混合模型的平均识别率为65.35%,与单一隐马尔科夫模型相比识别率提高了5.25%,识别效果更好。同时又在信号中加入白噪声进行了混合模型鲁棒性测试,结果表明本文混合模型的抗噪性能要优于单一隐马尔科夫模型。
其他文献
运动目标跟踪作为计算机视觉领域的重要分支,在安防工程、交通监控等领域得到了广泛的应用。近些年来,随着水上运动的普及和安全意识的提高,水上人体目标跟踪受到了越来越多
户用光伏储能系统中,如何实现对户用光伏电池、储能电池、户用负载和交流电网的运行状态及主要参数的监测、控制和保护,如何协调好户用光伏电池、储能电池、户用负载和交流电网之间能量的合理调配,研究户用光伏储能系统的能源管理装置具有重要意义。本文阐述课题研究背景、研究目的与研究意义,对国内外能源管理装置的发展及研究现状做了具体分析。阐述能源管理装置的功能,控制方案及工作原理,确定能源管理装置的总体架构。在硬
随着计算机技术和成像技术的发展,数字图像处理技术在各个领域得到了广泛的应用。为了提高图像处理的速度,使图像处理过程更加可视化,是设计基于图形化组态的图像处理开发平