情感语音识别与合成的研究

来源 :太原理工大学 | 被引量 : 11次 | 上传用户:l_zhanghk
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
情感语音识别与合成技术是当前语音信号处理研究的热点问题,目的是使计算机既能够听懂人类语言所携带的情感成分,又可以说出人类语言,实现人机智能通信,使计算机与人的交流畅通无阻。情感语音识别是语音识别技术的一个新的分支,由于情感本身概念的不确定性及语音中情感特征的模糊性,使得情感语音识别成为一个难点问题。语音合成技术一直以来研究者众多,但是,如何能够构建出一个存储量小,自然度高的合成系统一直是需要重点解决的问题。本文紧紧抓住情感语音识别的难点和语音合成的重点,提出了基于人耳听觉特性模型的情感语音识别特征,并用声门特征对基于人耳听觉的情感语音特征进行了补偿优化;实现了基于隐马尔科夫模型的语音合成系统,在此基础上,对系统合成的语音进行了参数分析和修改,将情感特征加入了合成语音,实现了基于隐马尔科夫模型的情感语音合成。本文的主要工作和创新性成果如下:(1)在深入研究情感理论的基础上,分析了韵律特征在不同情感中的表现,构建了包括“高兴”、“生气”和“中立”三种情感状态,汉语普通话和英语两种语言的TYUT情感语音数据库。通过主观辨听实验和典型特征的分析实验,确定了TYUT情感语音数据库的有效性。(2)将基于人耳听觉特性模型的过零峰值幅度特征用于情感语音识别,并将该特征中用于代表频率与说话速率的过零特征与Teager能量算子中的非线性能量特征有机地结合在一起,提出了一种基于人耳听觉特性模型的新特征——过零最大Teager能量算子特征,新特征在情感语音识别实验中表现出良好的性能。(3)将人的发音模型与听觉模型相结合,通过分析声门特征对人耳听觉模型特征的影响,提出了用声门特征补偿人耳听觉特征的新算法,并将补偿后的新算法用于情感识别实验,得到了较高的识别率。新算法表现出了优良的性能。(4)针对实际交谈中,背景环境复杂的情况,设计了一种混合情感语音数据库的实验,用以检验情感特征的数据库独立性。通过对混合语音数据库实验结果的对比,发现过零最大Teager能量算子特征是本文所有特征中,数据库依赖性最小的特征。(5)为了能够合成出具有不同情感的语句,首先,搭建了基于隐马尔科夫模型的情感语音合成系统,接着对合成出的语句进行了参数修改,最终实现了基于隐马尔科夫模型的情感语音合成,初步得到了合成的情感语音。
其他文献
塑料因其易制造、功能多样、使用方便等原因多年来被大量生产并使用,但由此而产生的环境污染问题愈发严重。优其是近年来研究发现大多数塑料制品被丢弃后并未完全降解,大量的
我国现有的农业产业链协调机制包括政府协调型、企业协调型、市场协调型以及中介组织协调型。作为中介组织的一种形式,农业专业合作社在农业产业链内部发挥着积极的协调作用
面对激烈的市场竞争,战略联盟和并购成为企业成长的两种主要战略选择。本文试图从定量化角度,为企业联盟与并购的战略选择提供决策依据。
为了提高壳聚糖/玉米醇溶蛋白膜的机械性能,将壳聚糖液与玉米醇溶蛋白液共混,向其中加入含量为0、15%、30%、45%(以复合膜液中壳聚糖和玉米醇溶蛋白的总质量为基准,下同)的油
随着我国经济的快速发展,人们越来越意识到职业教育的重要性,而职业学院只有不断提高教育质量、大力开展教学改革、建设高素质的教师队伍,才能促进职业学院的健康发展,主要论
人的本质观点是马克思人学的核心观点。马克思以实践为立足点对人的本质进行创造性的概括。这种创造性的概括对于解决当前人的异化这一困境具有十分重要的指导意义,即以实践
<正> 童年时代,就听到塾师讲述过《七步诗》的故事。当时在我幼稚的心灵里,对这位才华横溢、风流绝代的曹植,已留下深刻的印象。年龄稍长,读《三国演义》,对这故事的描写、叙
随着金属带锯床在金属切削行业所扮演的角色越来越重要,人们对带锯床的性能提出了更高的要求,具体表现在三个方面:一是希望锯切效率能够提高,具体表现是对于一定厚度的金属材
规范会计理论与实证会计理论评析及启示●陈汉文林志毅规范会计理论是一套关于会计“应该是什么”的系统知识体系,旨在通过一系列基本会计原则、会计准则的规范要求,从逻辑高度
实习是学生快速提升专业综合能力的基本途径之一,也是完成由"学生"向"职业人"角色转变必经的实践性教学环节。高职学前教育专业具有职业性和师范性的双重特点,学生教学基本功