基于深度神经网络的韵律结构预测研究

来源 :北京交通大学 | 被引量 : 7次 | 上传用户:www136768
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
汉语韵律预测对合成语音的自然度起着重要作用,本文的研究重点是如何提高韵律层级结构的预测准确率。以往基于统计的韵律结构预测模型,在输入特征的选取中往往使用POS (Part of Speech)词性特征,POS特征为浅层信息,无法利用词语的语义信息,且选取的特征因为词与词之间缺乏关联,往往会形成“词汇鸿沟”现象,导致即使同义词也无法表现出相应的关联性。因此,需要使用一种能体现词语关联性的表达方式作为模型的输入特征。在模型选择上,隐马尔科夫模型、决策树模型虽然在韵律结构预测中取得了成功,但会产生适用范围窄、过拟合等问题。随着数据复杂性越来越大,需要使用一种对数据建模能力更强的模型方法,而深度神经网络对复杂数据有很好的建模能力。因此,本文围绕以词向量为输入特征的基于深度神经网络模型的韵律结构预测模型展开研究。本文一方面对词向量进行训练,由词向量构建韵律词向量,采用复合向量作为模型的输入;另一方面,对传统神经网络模型进行了改进,使神经网络的隐藏层能更好的捕捉词与词之间的交互联系。主要工作包括:(1)配置Gensim词向量训练模块,通过Gensim模块训练词向量,利用训练后的词向量学习韵律词向量,通过不同层级的向量来抓取上下文中的韵律层级信息;(2)利用韵律层级标注数据训练神经网络模型,使用词典词向量、韵律词向量、前词韵律层级向量和当前词的词长向量作步输入特征,通过在模型的输入层使用复合输入特征来提高模型的预测能力;(3)对模型隐藏层进行改进,在隐藏层中添加张量矩阵,通过张量矩阵捕捉词与词之间、不同韵律层级之间的联系,分别从窗口长度、空间维度、隐藏层单元数量、输入特征等方面对模型的韵律结构预测能力进行验证。实验结果显示:多向量结合的复合输入特征与单一词向量作为输入特征的预测结果相比,韵律词的错误率降低了3.2%(从15.3%降至12.1%),而韵律短语的错误率降低了5%(从40.3%降至35.3%);隐藏层中添加张量矩阵之后,韵律词的错误率降低了0.5%(从12.1%降至11.6%)。实验结果表明:复合输入特征能有效改善韵律预测的错误率;带有张量矩阵的隐藏层与普通隐藏层相比,能够更好地捕捉韵律层级之间的信息。
其他文献
市场经济条件下,品牌作为企业的无形资产具有重要作用,一个良好的品牌能够促进企业产品的销售和市场的扩张,能够提升企业竞争力和整体价值。上个世纪80年代以来,国内外学者对
以某2 060 t/h W火焰锅炉为研究对象,在分析研究对象现状的基础上,总结改变燃料特性以后锅炉燃烧工况发生的变化,分析多煤种混合燃烧对锅炉运行性能的影响机理,采用热重分析
作为我国重要的基础能源,煤炭在经济社会发展中具有战略性地位。但我国煤矿业的重、特大事故频发,严重威胁到了矿工的人身和财产安全。为此政府建立了日渐完善的煤矿安全规制
目的:探讨地氯雷他定干混悬剂联合糖皮质激素布地奈德鼻喷雾剂治疗小儿过敏性鼻炎的效果。方法:选取2019年5月~2020年5月门诊接诊的70例过敏性鼻炎患儿为研究对象,根据患儿就
病从口来膳食不当最麻烦 大凡有过比较的人都知道,北方人口重,吃东西咸,盐放得太多。这是一种生活习惯。北方无霜期短,蔬菜供应远不如江南,由冬到夏,有将近半年的时间靠萝卜、土豆
目前,以沪深两市为代表的资本市场迅猛发展,在上市公司的日常交易中关联方交易所占的比重日益增大,在成熟的市场中这些并不成问题。但是在中国目前的现实经济体制环境下,由于
酒店产业发展到今天,不同国度不同区域的酒店,有着不同特色的酒店文化。在全球化的背景下,不同酒店文化有着不同的地域特色。酒店设计文化,已经是现代性、地域性、国际性交相
第一章:简介对俄罗斯而言,多年来其与欧洲的关系一直十分重要。就目前而言,双方之间的能源互补关系非但没有减少,反而显得更加重要。近年来,欧盟与俄罗斯双方所开展对话正不
新能源汽车已不再是一个新兴的名词,迫于能源安全和环境保护的双重压力,发展新能源汽车是国际潮流大势所趋,传统的燃油汽车将逐渐会被绿色的新能源汽车所取代,新能源汽车的发