深度神经网络建模方法用于数据缺乏的带口音普通话语音识别的研究

来源 :集成技术 | 被引量 : 0次 | 上传用户:fuyunyang1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
众所周知中文普通话被众多的地区口音强烈地影响着,然而带不同口音的普通话语音数据却十分缺乏。因此,普通话语音识别的一个重要目标是恰当地模拟口音带来的声学变化。文章给出了隐式和显式地使用口音信息的一系列基于深度神经网络的声学模型技术的研究。与此同时,包括混合条件训练,多口音决策树状态绑定,深度神经网络级联和多级自适应网络级联隐马尔可夫模型建模等的多口音建模方法在本文中被组合和比较。一个能显式地利用口音信息的改进多级自适应网络级联隐马尔可夫模型系统被提出,并应用于一个由四个地区口音组成的、数据缺乏的带口音普通话语音识别任务中。在经过序列区分性训练和自适应后,通过绝对上0.8%到1.5%(相对上6%到9%)的字错误率下降,该系统显著地优于基线的口音独立深度神经网络级联系统。
其他文献
目的探讨慢性酒精中毒性神经病(CAND)患者皮肤交感反应(SSR)的改变,提供自主神经受损的客观依据。方法分别检测34例CAND患者(CAND组)和30例健康对照者(对照组)四肢的SSR,对2
目的 通过对手术治疗髋臼后壁骨折的回顾性研究,分析影响其疗效的因素. 方法 1993年8月-2004年8月手术治疗髋臼后壁骨折74例,用改良的Mede d'Aubigné和Postel评分系统评价临
目的 探讨氧自由基清除剂对大鼠肝脏缺血再灌注损伤的保护作用及其机理.方法 将Wistar大鼠分成三组,各组通过门静脉插管,对肝脏进行原位灌洗,心脏博动组以4℃ HTK液灌洗;心脏
肾综合征出血热(HFRS)职业暴露主要是从事教学、科研等工作需要与大白鼠等实验动物接触的人员,从事HFRS现场流行病学调查和灭鼠的人员,饲养、销售、运送野鼠和大白鼠等实验动
目的 探讨有创通气治疗连枷胸合并肺挫伤的时间和效果.方法 回顾性分析南京医科大学附属南京第一医院2004年1月至2006年7月收治的16例严重连枷胸合并肺挫伤患者,在脉搏氧饱和
文章从经营理念、资源管理、商业模式、市场运行、新文明等几个方面分析了淘宝网的成功之处,并就如何把淘宝网的成功经验迁移到校园网的建设与应用过程中进行了探讨,提出在校
旅游危机对旅游业的影响十分巨大.文章试图从旅游危机的作用机制出发,提出识别的技巧,为构建旅游危机的预防体系起到一定的作用,这对于旅游行业来说有着现实和深远的意义.
本文旨在了解现代中学生价值观的现状,采用分层随机抽样的方法在郑州市及其周边农村随机抽取初一至高三共l37名学生进行价值观问卷调查.结果发现:①中学生价值观的总均分为3.
目的 探讨补血活血中药对口腔扁平苔藓(OLP)患者TNF-α、IL-8及sIL-2R水平调节作用,为临床用药提供依据。方法 40例OLP患者随机分为两组,分别给予补血活血中药和雷公藤总甙片进行
白细胞介素 6 (interleukin ,IL 6 )是细胞因子网络中一种主要的多功能细胞因子 ,它或它的受体的失调性表达 ,可能与许多疾病的发病机理有关。我们观察了慢性宫颈炎组织中IL 6的异常表达情