基于韵律语段的语音情感识别方法研究

来源 :清华大学学报(自然科学版) | 被引量 : 19次 | 上传用户:pengpengice
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音情感识别领域提取情感特征时,普遍采用"不同情感类别,相同时长基准"的做法,忽略了人耳敏感的韵律段长会依情感不同而有所差异的现象。本文首先通过情感识别实验确定各类情感的最佳识别段长,作为人耳敏感韵律段长。并构造了基于韵律段特征的多重Elman网络模型,以期对不同情感基于特定敏感韵律段长进行识别和对多分类器识别结果进行有效融合,实现了对人耳情感辨识规律的模拟。结果表明,使用敏感韵律段特征的系统识别率达到67.9%,与使用定长语段特征相比有了很大的提高。
其他文献
文章主要探讨一种操作性较强的、面向CTTS应用的语句韵律词及韵律短语预测系统,这一系统预测韵律结构只依赖语句的词类音节数序列等简单的文本信息。文章区分了现代汉语中韵律
本文提出一种用于HMM参数化语音合成的针对清浊音优化的基频建模和预测方法。在参数化合成方法中,清浊音预测直接决定激励源的选择,对合成质量有关键影响。针对这一问题,该方法
会议
本文提出了一种新的、基于拼接语音合成系统的韵律自适应模型。该模型能够利用目标说话人少量的语料使语音合成系统合成具有目标说话人韵律特征的语音。同基于平行语料的韵律
语音的韵律特征对情感表达起着非常重要的作用。在基于韵律修改的情感语音转换系统中,为了更为准确地预测情感语音的韵律特征,该文提出一种层次化的韵律分析与建模方法,针对愤怒、高兴、悲伤、惊奇这4种情感对语音按照韵律结构的层级进行分析,探讨不同层次之间情感韵律特征变化规律的关联性和叠加性,并使用高层音段信息作为输入对低层信息进行决策树建模。实验结果表明,本方法对情感韵律特征的预测均方误差比局部分音段以及传
会议
意见目标抽取是意见挖掘研究中的重要环节。现有方法的主要问题是将人工标注的意见目标直接视为"种子"进行意见目标扩展。本文提出了一种基于泛化、繁殖和自举的意见目标抽取
会议
人在说话的时候有各种各样的发音方式,如不同的语言;带情感的发音;快速与慢速、大声与小声等等。如果不做任何处理,直接用传统的说话人识别方法来处理,结果会比较差。因此,本论文研
会议
中国地域辽阔,汉语包括多种方言。方言转换技术可实现方言间语音的转换,丰富语音交流的方式,增强语音交流的可懂性、友好性和趣味性。该文分析了普通话与沈阳方言在声调调类与调
会议
实际环境下,一个说话人识别系统的性能受到很多因素的影响,说话人自身发音方式的变化所引起的训练与识别语音的不匹配是其中很重要的一个方面。本文以一个含有多种发音方式变化
为满足言语工程需要,基于大规模语料库,选择了记叙文、说明文、议论文、新闻和专题五种朗读语体,在时长、音高方面对其重音特征进行分析。结果表明,各语体在总体特征、重音突显和
提出一种用于哼唱识别精确匹配的线性伸缩动态规划算法。该算法将哼唱旋律切割成句子,对每一句子进行线性伸缩匹配,同时在句子层次进行动态规划获得最优路径。该算法更有效地利用了哼唱语音的分段特性并克服了动态规划在长路径搜索时可能丢失全局最优路径的缺点。在含5 223首M ID I的数据库上同等条件下该算法正确率分别比线性伸缩、动态规划及递归匹配方法提高10.5%、6.0%和2.8%。该算法具有更高的准确率