语音合成中韵律结构预测改进

来源 :北京交通大学 | 被引量 : 4次 | 上传用户:IBMWiki
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
韵律结构是影响语音合成中语音自然度的关键因素之一,对韵律结构预测的研究具有重要意义。传统的基于规则和基于统计的韵律预测模型建模方法在应用中取得了许多成功,但其在选取输入特征时多使用词性(Part-of-Speech,POS)等浅层信息,忽略了语义和语法等深层信息对韵律结构的影响。另外,当数据复杂性很大时,会出现适用范围窄、过拟合以及过于依赖规则等问题。针对传统方法中存在的局限性,需要一种对复杂数据建模能力很强的模型且模型的输入需表征深层信息。本文在韵律结构预测模块中引入深度学习,基于词向量作为模型输入特征的深度神经网络预测模型进行研究。论文的主要工作如下:(1)准备文本语料库训练词向量,使用训练得到的词向量替代传统的POS信息作为预测模型的输入,在模型的输入特征中加入词长信息和标点信息,从而增加输入特征中包含的信息,提高模型的学习效果;(2)采用全连接的前馈网络(FF)与双向长短时记忆单元(BLSTM)网络组合的网络结构对韵律预测模型建模,对比不同网络结构下韵律层级预测模型的预测结果,找到较好的预测模型网络结构;(3)为了进一步提高基于深度学习的韵律结构预测模型的预测效果,在网络模型之后,利用网络模型的输出打分和韵律结构类别之间的转移打分进行动态规划,找到网络模型输入语句对应的最优韵律层级类别序列。
其他文献
该文在目前我国场坪混凝土施工现状的基础上,结合实际工程施工实例,从配合比设计、搅拌运输、浇注成型、养护切缝等方面论述了加入引气减水剂的混凝土在场坪工程中的施工技术
制造业是人类生存和社会发展的基础产业,其发展程度直接体现了一个地区的生产力水平,是区域经济增长和社会发展的重要依托。随着世界经济一体化进程的加快,伴随着原材料成本
成本管理是企业进行日常管理的重要组成部分,无论是哪个企业的管理者都十分重视成本管理。但成本管理在我国目前的企业层面是远远落后于其他发达国家的。主要不足是我国企业
目前,资本账户开放的度量可分为法规度量和事实度量两大类。本文利用F-H储蓄投资法、E-K利率平价法、LMF资本存量法和资产价格关联法等事实度量方法,分别从国民储蓄与投资的
行政垄断有效地抵御了境外石油威胁,保护了我国石油安全,但随着社会的进一步发展,绝对垄断已经开始影响我国经济社会的正常发展,一定程度上导致了油荒、油价上涨等问题.面对
内部控制作为企业管理的重头戏,关系到企业各项工作的顺利开展,对全面提升企业的经营管理水平有着相当重要的作用。事实上,我国大部分基层供电企业的内部控制现状不容乐观,管
当前,国外一些运动服装品牌加快抢占国内运动服装市场份额的步伐,加剧了本土运动服装品牌的竞争压力。为了能够帮助本土运动服装品牌更精确地定位市场,设计出满足细分市场消
本文以CGCS2000启用后城市平面坐标系的选取和确定为研究内容,提出了以投影改正平方和最小和投影变形大于2.5 cm/km的点数最少为原则进行最佳中央子午线和抵偿高程面选取的方
幼儿教育是儿童成长发育过程中的重要环节,幼儿园儿童在幼儿园内的权利保护是我国保护儿童权利过程中应当重视的重要问题。本文对目前我国幼儿园儿童权利受侵害的状况进行阐