基于BLSTM和CTC的藏语语音识别

来源 :青海师范大学学报(自然科学版) | 被引量 : 0次 | 上传用户:a1470447
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着深度学习理论的兴起,BLSTM-CTC模型成为目前主流的语音识别声学模型之一.本文借鉴国内外语音识别框架,结合藏语言文字特点,提出基于BLSTM-CTC模型的藏语语音识别方法.该方法以识别非特定人藏语连续语音为目标,通过提取语音的MFCC特征参数,建立了以音素为建模单元的藏语语音声学模型.在不同建模单元下LSTM-CTC模型和BLSTM-CTC模型的对比实验表明,该方法能够充分利用上下文信息,具有较强的建模能力和语音识别效果.
其他文献
针对平衰信道下传统单天线散射系统的通信质量下降的问题,设计了一种频率分集与时间分集相结合的一种分集接收方案,给出了具体的实现思路与参数的取舍原则,并搭建了硬件测试
本文介绍了升学与就业指导测验的历史和发展现状,包括升学与就业指导测验的起源、编制特点、应用价值,并对几个相关问题进行了讨论。
电影配乐不但带给观众以丰富的感官审美,也能够推动影片实现更深层次的审美主旨,即对电影精神内涵的烘托与诠释。音乐对主题的诠释的形式之一是配合影片的具体叙事。另外,人是影
<正> 最近在上海举行的社会主义初级阶段理论讨论会上,对划分社会主义初级阶段提出了几种标准:生产力标准.认为生产力是社会主义初级阶段的划分的首要标准.有的同志主张生产
新闻评论写作靠的就是&#39;在战斗中成长&#39;。新闻评论是社会发展的重要舆论动员和意识整合工具。一些媒体人之所以没有学习、练习好新闻评论写作,主要是心理上存在认识不
汽车维修业转型升级是行业政策导向,是市场发展的内在要求,也必然带来市场业态的深刻变化。特别是“互联网+”思维的渗透,让汽修这个传统行业遭遇前所未有的挑战。而汽修技术
目的探讨婴幼儿佝偻病与血清25羟维生素D[25-hydroxy vitamin D,25-(OH) D]的相关性,为婴幼儿佝偻病的诊断与防治提供参考。方法选取2017年10月-2018月10月在本院就诊或体检
<正> 目前,关于社会主义初级阶段划分标准的问题,理论界、学术界展开了热烈的讨论。有人提出以社会生产力为标准,有人提出以社会生产关系为标准,还有人提出以生产方式为标准,
地方文化是美术校本课程资源的重要组成部分.厦门海沧有着丰富深厚的地方文化资源,但几乎不被重视、并正遭受破坏.提高学生的地方文化保护意识,可以地方文化为支点,结合绿活
目的:建立稳定的慢性实验性糖尿病大鼠脑缺血再灌注损伤模型,明确糖尿病与正常大鼠脑缺血损伤的异同之处。方法:以链脲佐菌素诱导产生实验性糖尿病大鼠,饲养40d左右,经测定血