论文部分内容阅读
文语转换(TTS)是近年来语音处理领域内比较热门的研究对象,其功能是由计算机将文字文本转换成语音并输出。一个成功的文语转换系统输出的语音应当音质清晰,自然流畅。 本文重点研究了韵律结构预测模型。为此,首先在学习语言学韵律结构知识的基础上对语料库进行了人工标注。然后用决策树算法对其进行了训练和评测,从而得到韵律结构预测模型。把韵律结构预测模型加入到文语转换系统中,取得了良好的效果。 文语转换系统中的语音合成模块用的是TD-PSOLA算法,这种算法要求提供原始的语音波形以及基音标记信息。要对语音库进行韵律标注,首先要把有声段切分出来,以便下一步进行音节切分、声韵切分、基音标注等。本文将采用一种语音分割算法,实现对语音库有声段的切分。 为了更好地进行韵律控制,本文还探索一种新的语音合成方法,即采用隐马尔可夫模型的合成方法。