基于CNN的藏族学生国家通用语发音偏误检测研究

来源 :西北师范大学 | 被引量 : 0次 | 上传用户:a13315157220
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在当今这个大发展、大融合的社会,需要人们能够说一口标准的国家通用语,以便对话双方能够精准理解,因此提升国家通用语发音水平已经成了个人发展要求。近年来,随着中国西部大开发计划的实施,与内地的经济和文化交流不断加强深入,藏区经济得到了快速发展。在这样的大背景下,藏族人民对学习国家通用语的需求越来越大,有效的帮助藏语语者学习好国家通用语显得尤为重要。因此,有必要针对藏语语者说国家通用语的发音偏误自动检测技术深入系统地研究。同时,发音偏误自动检测是面向计算机辅助语音训练系统(computer assisted pronunciation training system,CAPT)的核心技术,其研究成果对补充现有的学习资源,为学习者提供无障碍的、减少焦虑的和个性化的学习方式,具有重要的意义和实用价值,应用前景广阔。本文以藏母语人群的国家通用语发音为研究对象,以声母、韵母和声调发音偏误为研究内容,结合语言语音学知识和深度学习技术,对藏母语人群的国家通用语发音偏误自动检测技术方法进行了深入研究。文章主要工作和创新点如下:语料库数据标注。对本文使用的语料库采用扩展声韵母的标注方式,使每个音节都具有严格的“声-韵-调”三元结构,为此扩展出了7个零声母;并且根据这种三元结构将发音偏误分为声母发音偏误、韵母发音偏误和声调发音偏误三大类别;根据各自的结构特点,又将这三类偏误细分为了64种发音偏误。国家通用语发音偏误检测。结合链接时序分类技术和神经网络技术,搭建了基于端到端的发音偏误检测模型,并在该模型下完成了藏族学生说国家通用语的发音偏误检测实验。实验结果表明,实验取得了88.35%的正确检测率和14.91%的联合错误率;能够有效的从声母、韵母和声调三个角度检测出藏族学生说国家通用语时的发音偏误信息。语料库的设计与建立。根据汉藏双语的发音特点及规律设计了PSC-test-1语音数据库,共有2268句语音数据和10个说话人,该语音数据库用来测试系统性能。从4个开源的国家通用语标准发音语音数据库中筛选出了PSC-train-1数据集,用于训练声学模型。
其他文献
基因表达的调控对于细胞的生存能力至关重要。特定基因的过度表达或表达不足会导致灾难性的细胞事件,最终可能直接致使细胞死亡;或者在癌症中导致细胞永生。染色体DNA不仅包含生命的遗传信息,还包含着自身的加工信息。基于现有的研究,我们已经认识到,经典的B型DNA双螺旋结构作为遗传信息的传递者,具有稳定传代、指导蛋白质合成等基础功能;而其他不同种类的非经典DNA二级结构,比如:左手Z型DNA、发夹、三链体、
在数论问题的研究中,多项式和递推序列一直深受学者的喜爱,特别是两类切比雪夫多项式、斐波那契多项式、勒让德多项式、卢卡斯多项式等,它们在多项式的研究中扮演着极其重要的角色。近几年来许多专家、学者把对多项式的有限乘积和作为数论的热点问题之一进行研究,得到了很多有趣的恒等式。但是在研究过程中当数字过大,会出现不易计算等问题,本文以此为出发点,利用第一类切比雪夫多项式的分析方法和性质,研究勒让德多项式的有
COVID-19自2019年12月末爆发以来,已经深刻改变了人类的生产、生活方式。截止2021年3月27日,全球已有超过一亿人感染新冠肺炎,死亡人数更是高达270万。COVID-19是由SARS-CoV-2冠状病毒感染引起的肺炎。在过去的二十年里,冠状病毒曾导致了两次大规模的流行病,包括SARS和MERS,其中SARS-CoV与SARSCoV-2的氨基酸序列有约80%的一致性。这两种病毒都可以利用
植被物候与生产力对区域气候变化的响应关系是全球气候变化研究的核心内容之一。黄土高原是我国的生态脆弱区和气候敏感区,分析黄土高原植被物候和生产力变化特征以及对区域气候波动的响应,对该地区合理实施退耕还林(草)政策、有效利用植被资源和促进当地农牧业稳定发展具有重要意义。本研究基于2001~2016年的MODIS NDVI数据,采用动态阈值法提取了黄土高原植被生长季节的起始期和结束期并计算植被的生长季长
本研究在黄土丘陵沟壑区安塞的坊塌流域和纸坊沟流域,以不同植被恢复方式的固定样地为研究对象,选择了2个人工刺槐林、2个人工柠条锦鸡儿林、2个山杏+刺槐半人工林及7个不同演替阶段的自然植物群落,采用样方逐年调查的方法,研究了不同植被恢复方式下的物种组成和群落结构的动态变化过程,主要结果如下:(1)有砍伐的刺槐林在恢复到30-35年期间,林下植物群落处于不稳定状态,植被始终菊科和禾本科为主,1-2年草本
毒素-抗毒素系统(Toxin-Antitoxin system,TAs)普遍存在于细菌和古菌的染色体和质粒上,该系统由两个共表达的基因组成,分别编码稳定的毒素和不稳定的抗毒素。毒素表达后通常能够影响细胞的重要生理过程,最终导致细胞生长停滞或者死亡,而抗毒素能够中和毒素的毒性从而对细菌起保护作用。TA系统通常被认为是细菌应激反应的基因模块,在细胞胁迫适应性、营养应激反应、细菌耐药性、抗生素耐受性、持
解旋酶是一种利用源自ATP水解产生的能量来分离核酸双链体互补链的分子马达蛋白。Rec Q解旋酶从原核生物到真核生物都高度保守,并在维持机体稳定、保护基因组免受有害化方面起关键作用。WRN在分类上属于解旋酶超家族II中Rec Q亚家族的一类DNA解旋酶。在人体细胞中发现的五种Rec Q解旋酶中,WRN(Werner综合征蛋白),BLM(Bloom综合征蛋白)和Rec Q4的缺乏分别导致罕见的隐性遗传
根是陆生植物生长必需的组成部分,其生长和形态建成是植物发育中的重要一环,受多种内外环境信号和代谢途径的共同影响与调节。其中,染色质修饰起着重要的调控作用。组蛋白乙酰化与去乙酰化修饰是基因转录调控的关键机制之一,与基因表达的活跃和沉默密切相关。组蛋白去乙酰化酶(HDACs)作为在真核生物(包括酵母、哺乳动物和植物)中广泛存在的一个超基因家族,在调节植物生长、器官发育和逆境胁迫响应反应中起关键作用。前
本文主要研究了一类无穷区间上的最优控制问题,其中,状态方程由随机时滞发展方程(SDEE)给出,相应的伴随方程由一类新的超前倒向随机发展方程(ABSEE)给出.首先,文章拓展了It?公式的形式.其次,证明了无穷区间上SDEEs解的存在唯一性定理.第三,建立了ABSEEs解的先验估计,进而得到了无穷区间上ABSEEs解的存在唯一性结果.最后,以Pontryagin最大值原理的形式,建立了无穷区间上最优
表面等离极化激元是一种具有亚波长束缚特性的瞬逝波,它沿金属-介质表面进行传播,不仅可以突破光的衍射极限,还拥有对周围环境和结构介电参数敏感的特性,因而广泛运用于亚波长微型光电子传感器中。在基于表面等离极化激元设计的众多结构中,金属-介质-金属结构因其结构简单、易于集成,在亚波长光学器件中表现出良好的运用前景。Fano共振是连续亮态受离散暗态冲击而形成的。与洛伦兹峰相比Fano峰不仅能增强场的分布,