基于韵律变换的情感说话人识别

来源 :东南大学学报:英文版 | 被引量 : 0次 | 上传用户:k3392301
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了解决由情感变化引起的说话人识别性能下降问题,提出了一种新的情感说话人识别系统.首先,通过引入情感识别作为前端处理模块,对中性语音和情感语音进行分类.然后,对情感语音进行韵律修正,分别采用高斯归一化、高斯混合模型(GMM)和支持向量回归(SVR)等方法建立情感语音和中性语音的基频映射规则,并根据平均线性变化率对时长进行了修正.最后,对韵律修正后的情感语音进行识别.实验结果表明,提出的情感说话人识别系统可以有效地提高情感说话人识别的性能,识别率相比传统方法有了显著的提高.并且通过基频和时长修正的情感语音更
其他文献
利用Frenet.Serret公式来讨论R^3中定常角的直纹面,给出了它们的特征分类.如果定常角曲面是具有r(s,1,)=σ(s)+1,(cosa(s)·t(s)+sina(s)·n(S))形式的切线面和法向曲面,则它们局部等距于平
针对摄像头离散区域存在的光照变化、视角变化等干扰,提出一种结合Lab模型以及扩展梯度方向直方图特征的方法来改善人物外表匹配的准确率.对于描述目标全局信息的Lab模型,提出一
为了解决基于攻击检测的综合联动控制问题,用博弈论方法对防火墙、入侵检测系统(IDS)和漏洞扫描技术的安全组合模型进行分析.采用逆序归纳法研究了仅配置IDS和漏洞扫描技术组合、
研究了在树网络上的2-重心选址改进问题,该问题是指以最少的花费调整各边的权值使得修改后网络中所有顶点到2个预设点的赋权距离的和不超过给定的上界。采用l1模和l∞模衡量总
为了提高扩展的二元相移键控(EBPSK)接收机的检测精度,设计了一种基于改进粒子群算法(IMPSO)和BP神经网络的EBPSK检测器.首先,阐述了EBPSK调制特征及冲击滤波器的特殊滤波机理.然后,提