语音转换关键技术研究

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:hujieguang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音转换是一种改变源说话人的语音个性特征,使之听起来像另外一个我们称为目标说话人的声音的技术。语音转换的基本要求是转换后的语音具有目标说话人的个性特征,但是并不改变原来说话人语音中的语意内容。虽然语音转换这个课题的提出已有二十多年的历史,但真正引起广泛关注并得到快速发展就在这最近的几年,可以说语音转换是语音信号处理的一个新兴研究方向,具有重要的理论价值和广泛的应用价值。本课题主要研究语音转换系统的基本理论和关键技术。   本文主要研究了对齐语音库下的语音转换方案。即在训练阶段我们有源说话人和目标说话人说相同语音的波形文件条件下的转换。本文着眼点是在高质量的STRAIGHT(Speech transformation and representation using adaptive interpolation of weighted spectrum)语音分析合成模型下所做的一些工作。本文主要完成了以下几方面的工作:   首先,简单介绍了论文的研究背景,语音转换的研究状况。给出了语音转换系统中涉及到的一些基本概念包括语音发音系统,语音转换结构图,语音转换实现的关键要素,常用的评价标准以及语音库的设计。还介绍了本文所涉及到的基本模型,包括语音分析合成模型线性预测模型(LPC)和STRAIGHT模型以及概率统计模型高斯混合模型(GMM)。并指出了STRAIGHT模型优于LPC模型的地方,以及如何利用STRAIGHT模型获得我们所关心的表征说话人个性特征的参数信息。   其次,列举了目前已有的关于语音转换的一些算法。给出了韵律转换方法的改进方案。还讨论了基于STRAIGHT模型的语音转换方案,分别从训练数据的准备,转换方案的选择,到最后合成具有目标说话人个性特征的语音几个方面进行探讨,并给出了所提方案仿真结果的分析和评价。   最后,总结了本文的工作,并指出了今后有待于进一步研究的方向。
其他文献
期刊
毛细支气管炎是呼吸道合胞病毒感染引起的婴幼儿急性下呼吸道感染性疾病[1],流行面广,发病率高,仅见于2岁以下的婴幼儿,以6个月内的婴儿为多。我们自2008年4月~2009年12月采用
期刊
移动Ad Hoc网络(Mobile Ad Hoc Networks,MANETs)是由一组带有无线收发装置的移动终端组成的多跳、临时、自治系统,适用于需要临时架设网络的场所,具有广阔的发展前景。节点
在对诸如海底沉船、海底输油管、堤坝等水下物体表面的探测中,光学成像对水文状况有很高的要求,其作用距离受到很大的限制。成像声纳则相对限制较少,可以在黑暗或者混浊水中
期刊
在未来无线通信系统中,中继技术是有效提升无线通信系统整体性能的关键技术之一。中继增强型蜂窝系统的性能分析及此新型系统下的多用户调度算法逐渐成为研究重点。本文首先通
目前,H.264视频压缩标准已经作为一种新型的标准被广泛的接受。主要原因在于H.264视频压缩标准与其它视频压缩标准相比具有压缩比和图像质量两方面的优势。在编码效率方面,H.26
期刊
目的:探讨小儿静脉留置针穿刺失败相关因素及护理对策.方法:对小儿静脉留置针穿刺失败的各种因素进行回顾性分析.结果:留置针穿刺失败以护士不良心理因素、患儿血管情况较差
在无线通信发展的数十年里,用户的数量越来越多,终端的功能也是日新月异。伴随着用户量增加的同时,干扰问题也随之而来。传统管理干扰的方法应用于当前密集多用户系统如当作