面向语音合成的缅语文本分析

来源 :云南大学 | 被引量 : 0次 | 上传用户:a7281423123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
缅甸语是缅甸联邦的通用语,使用的人口约有五千四百万,缅甸语和汉语一样是一种孤立语类型的语言,同时也是一种有声调的语言,由于这个特点,它的构词形式基本上有单纯词和合成词两种。本文以开发缅甸语语音合成系统为目标,研究语音合成系统中的前端文本分析方法。论文的主要工作包括:1.利用爬虫工具,从各类缅甸语网站下载大量语料,将语料整理、统一文本符号,并对语料进一步筛选,去除长度、格式不合适的语句,最后挑选出用于文本分析研究实验的语句。2.从专业的缅英词典软件中,抓取下缅语词条,构成粗制缅语词典。之后对粗词典进行整理、统一格式等,构建出用于缅语分词的词典。同时统一词典与文本的编码。3.参考缅语文献及缅语教辅等,详细研究分析缅语特点及其音节结构。归纳出缅语音节边界规则,用作缅语的音节划分。使用基于规则的方法,编写程序实现了缅语音节划分。实验结果表明,本文的音节划分规则正确率可达100%。4.根据缅语构词特点,选择基于词典的正向最大匹配算法对缅语进行分词。编写程序实现缅语自动分词时,以划分好的音节为单位,将音节拼接的结果与构建的词典匹配。实验结果表明,本文的分词正确率为80.6%。5.根据缅语音位系统及MLC转写系统,制定出缅语罗马化方案。方案继承了MLC转写系统优点的同时,优化了声调的罗马化转写。在罗马化方案的基础上,设计了罗马化的流程,并使用Python语言编程实现了缅语文本罗马化。实验结果表明,本文的罗马化正确率可达100%。6.研究缅语数字的读音特点,和缅语文本中数字的表示方式,构建缅语数字读音对照表及缅语常用量词表,其中包括缅语数字在不同情况下的变音现象。根据两个表和缅语特点,编写程序实现缅语数字的归一化。实验结果表明,本文的归一化正确率可达94.3%。综上所述,本文提出的音节边界规则、罗马化方案、分词方法及数字归一化方法可基本满足开发缅语语音合成系统的要求。
其他文献
目前我国各地都在进行高速公路改扩建工程,但是在施工过程中存在着征地受限的问题,因此必须减少高速公路的占地面积,节约土地资源。泡沫轻质土和液态粉煤灰为轻质填料,具有轻质性和直立性等优点,且作为路堤填料可以垂直填筑,无需放坡,能节约施工用地。本文依托新元高速公路改扩建工程,对泡沫轻质土路堤墙和液态粉煤灰路堤墙的材料性质、施工工艺、沉降变形进行了分析研究。本文主要通过室内土工试验、现场监测、数值模拟等方
新型周期褶皱金属表面作为超材料的二维平面结构,主要由周期或者准周期的亚波长结构单元按照一定规律的布列组成,具有灵活调控电磁参数的特性。相对于三维超材料而言,周期褶
本文阐述了精益管理的定义和认知。介绍了某铸造企业实际生产中发生的案例,查找此案例失败的根本原因的过程方法,运用精益管理的思路规范生产工艺过程、提高员工质量意识、改
高功率密度DC/DC电源模块被广泛应用于导弹、雷达等国防军工和航天、医疗等民用领域,为了满足需求,电源模块的功率密度在不断提高,同时散热问题也变得愈发严重,温度太高的话,内部的一些器件可能会热损坏,从而使得电源设备无法正常使用,可靠性下降,所以散热问题应当引起我们的注意。除此之外,电源模块的应用环境也十分复杂,高可靠性要求其能正常工作在各种极端环境下而不至失效。各研究机构的研究成果表明,决定可靠性
学位
对射电信号的高分辨率频谱或功率谱密度(Power Spectral Density,PSD)观测,有助于了解射电源的精细结构,为天体活动及其剧烈程度的预报、预警提供可靠依据。自相关频谱仪是射
目前,世界各地由于钢筋混凝土结构锈蚀产生的耐久问题日益增多。钢筋锈蚀不仅会使钢筋和混凝土的粘结力降低,而且随着锈蚀的进行,锈蚀产物的不断累积会产生锈胀力,导致混凝土的保护层发生开裂和剥落现象,诱发结构的耐久性问题。因此,钢筋的锈蚀损伤评定以及结构的健康监测等钢筋锈蚀混凝土耐久性问题的研究已经成为一个重大课题,有着重要的工程实际意义。本文从钢筋锈致损伤理论入手,基于声发射技术,对PVA纤维混凝土和普
益藩本《新刊大广益会玉篇》是明万历元年(公元1573年)益端王朱祐槟在《大广益会玉篇》的基础上编纂而成的一部大型字书。与《大广益会玉篇》各版本相比,该书在编纂体例和内
在油气田勘探与开发中层序地层学已经受到了广泛应用,对层序地层学的研究方法进行加强,有利于油气田钻探成功率的提高。本文主要是运用测井资料最大熵频谱的属性分析方法对层
光明网6月10日刊登马青的文章说,据媒体报道,广西未婚女子苏女士在河北省保定市唐县"被结婚"又"被离婚"后,涉事的河北省保定市唐县民政局主动联系当事人苏女士,称将办理撤销
微地震监测技术作为一种动态、实时、三维立体的重要安全监测手段,在矿山开采、隧道施工、水利压裂等工程应用中得到广泛应用。震源定位作为微地震监测系统中的核心技术,一直