论文部分内容阅读
语音转换是一种改变源说话人的语音个性特征,使之听起来像是从另外一个我们称为目标说话人的口中说出的语音一样的技术。语音转换的基本要求是转换后的语音具有目标说话人的个性特征,但是并不改变原来说话人语音中的语意内容。虽然语音转换这个课题的提出已有二十多年的历史,但真正引起广泛关注得到快速发展就在这最近的几年,可以说语音转换是语音信号处理的一个新兴研究方向,具有重要的理论价值和广泛的应用价值。本课题主要研究语音转换系统的基本理论和技术,课题得到江苏省青蓝工程资助。
本文首先基于语音的发音模型,分析介绍了语音转换系统的组成架构。详细介绍了用于语音转换的特征参数提取方法,根据提取的参数分别介绍了相应的转换规则,并且着重介绍了基于GMM模型的语音转换系统。GMM模型语音转换系统是近年来被广泛研究的语音转换系统,传统的GMM模型语音转换系统存在转换语音共振峰变宽,谱包络平滑的现象,本文认为主要是因为转换函数各个分量不加选择的全部使用引起的,针对此问题,本文提出一种新的基于邻近语音概率选择的Part-GMM语音转换系统,实验表明该系统一定程度上改善了传统GMM模型语音转换系统存在的问题。
目前流行的AMR语音编解码系统,是3G移动通信标准WCDMA和TD-SCDMA中的基带语音编解码方案,具有成熟的语音特征参数提取算法。因此本文在第二部分将其作为语音转换的基本合成模型加以着重研究,在第4章详细分析介绍了AMR的语音特征参数提取算法,并且针对AMR提供的双LSP参数、VAD信息、固定码本信息,提出在语音转换的训练阶段采用VAD-DTW联合动态规整LSP参数构想,以及在转换阶段基于VAD的判断选择转换策略,对于双LSP参数、基音参数、和固定码本参数分别选择相应的特征参数转换方法,最后给出比较完整的基于AMR的语音转换整体设计方案,具有一定的实际意义。