文语转换系统若干问题研究

来源 :北京邮电大学 | 被引量 : 7次 | 上传用户:shen888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文语转换(TTS)是近年来语音处理领域内比较热门的研究对象,其功能是由计算机将文字文本转换成语音并输出。一个成功的文语转换系统输出的语音应当音质清晰,自然流畅。 本文重点研究了韵律结构预测模型。为此,首先在学习语言学韵律结构知识的基础上对语料库进行了人工标注。然后用决策树算法对其进行了训练和评测,从而得到韵律结构预测模型。把韵律结构预测模型加入到文语转换系统中,取得了良好的效果。 文语转换系统中的语音合成模块用的是TD-PSOLA算法,这种算法要求提供原始的语音波形以及基音标记信息。要对语音库进行韵律标注,首先要把有声段切分出来,以便下一步进行音节切分、声韵切分、基音标注等。本文将采用一种语音分割算法,实现对语音库有声段的切分。 为了更好地进行韵律控制,本文还探索一种新的语音合成方法,即采用隐马尔可夫模型的合成方法。
其他文献
信息产业的飞速发展,尤其是因特网的普遍应用,使宽带化成为接入网的发展趋势。非对称数字用户环路(ADSL)技术是目前利用现有接入网(双绞线)进行宽带传输的最佳方式。 ADSL作
本文着重介绍了GPRS技术在专用通信网上的应用,通过对其理论和案例的分析归纳出适合采用这种技术的几种专用网络类型。既而根据实际的组网经验提出了一个新的通信模型,并对这个
在无中继长线传输中会出现信宿端信号严重失真的现象,对失真信号进行矫正是无中继长线传输系统中的重要一环。本文以“6000米海底有缆观测与采样系统---电视抓斗”为研究背景
无线传感器网络广泛应用于各个领域,能量获取成为一种解决传统传感器网络能量受限的可行方法。可获取能量的无线通信系统近年来受到学术界的普遍关注。中继协作无线传输技术
在图像去噪的研究中,如何在去除噪声的同时尽可能的保留图像细节信息是一个关键问题。多尺度几何分析方法的提出为解决这一问题提供了新的思路,将之用于图像去噪已经成为图像