论文部分内容阅读
语音转换是指改变源说话人的语音个性特征,使之具备目标说话人的语音个性特征,从而使源说话人的语音听起来像目标说话人的语音的一种处理技术。语音转换的研究是在语音识别和语音合成的研究基础上进行的,同时也是这两个领域的丰富和延拓,具有巨大的应用前景和理论研究价值。论文的主要工作包括以下几个方面:1.针对传统高斯混合模型中,高斯混合数过大会引起合成语音过平滑的问题,提出利用部分转换分量函数的加权和代替传统GMM模型的全转换函数,改善了过平滑现象。为进一步避免过平滑,利用弯折函数直接对LSF参数进行转换,并利用改进GMM模型的转换结果对语音谱进行调整,使语音谱包络的转换更加精确。2.在传统的基音周期检测方法的基础上,提出了一种新的基于RWAF变换的基音周期检测方法,并通过对候选值进行加权确定最终的基音周期,提高了基音周期检测的准确性。3.针对传统的基音周期转换仅对短时基频作固定均值转换的问题,提出从基频轨迹提取出基元段特征参数矢量,并利用基于GMM的独立建模方法对基元段参数空间进行训练,得到比固定转换规则更具优势的实时动态转换规则,使基音周期转换效果更好。F0 t4.将上述方法运用于语音转换系统进行仿真测试,从主观和客观两个方面对转换后的语音进行评价。实验结果表明,该系统在保证转换语音目标倾向性的同时,提高了语音质量,得到了较好的转换效果。