论文部分内容阅读
该文首先对语音合成研究的历史背景做了简单的回顾,指出了在现阶段研制实用化粤语语音合成系统的重要意义:接着对粤语语音的概貌做了详细的介绍;然后依次对建立基于大语料库粤语语音合成系统所需的关键技术(语料库设计、韵律模型设计和单元挑选策略)逐一进行论述.该文的结论部分简要地介绍了KBCT2.0的系统架构和性能指标评测,指出了进一步的研究内容和方向.在粤语语音概貌方面,详细分析了粤语语音的声韵调系统及其拼合关系,总结了粤语语音复杂的音变现象,提出了"正音"的原则和方法,为准确标注汉字的粤语拼音提供了依据.在语料库设计方面,提出了粤语"语境矢量"的独特设计和"语境总量"的独特概念.提出了"语境总量"的计算方法,为文本语料的搜索打下理论基础.在韵律模型设计方面,将基于机器学习的韵律建模方法应用到粤语语音合成系统当中,比较准确地预测出目标单元的基频、时长、停顿、能量等韵律特征.在单元挑选策略方面,通过连续三个备选音节的基频连接概率取代音段特征参数作为连接代价,取得了较为平滑、顺畅的合成语音.