基于DNN的低资源语音识别特征提取技术

来源 :自动化学报 | 被引量 : 0次 | 上传用户:softwareuse
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对低资源训练数据条件下深层神经网络(Deep neural network,DNN)特征声学建模性能急剧下降的问题,提出两种适合于低资源语音识别的深层神经网络特征提取方法.首先基于隐含层共享训练的网络结构,借助资源较为丰富的语料实现对深层瓶颈神经网络的辅助训练,针对BN层位于共享层的特点,引入Dropout,Maxout,Rectified linear units等技术改善多流训练样本分布不规律导致的过拟合问题,同时缩小网络参数规模、降低训练耗时;其次为了改善深层神经网络特征提取方法,提出一种基于凸非负矩阵分解(Convex-non-negative matrix factorization,CNMF)算法的低维高层特征提取技术,通过对网络的权值矩阵分解得到基矩阵作为特征层的权值矩阵,然后从该层提取一种新的低维特征.基于Vystadial 2013的1小时低资源捷克语训练语料的实验表明,在26.7小时的英语语料辅助训练下,当使用Dropout和Rectified linear units时,识别率相对基线系统提升7.0%;当使用Dropout和Maxout时,识别率相对基线系统提升了12.6%,且网络参数数量相对其他系统降低了62.7%,训练时间降低了25%.而基于矩阵分解的低维特征在单语言训练和辅助训练的两种情况下都取得了优于瓶颈特征(Bottleneck features,BNF)的识别率,且在辅助训练的情况下优于深层神经网络隐马尔科夫识别系统,提升幅度从0.8%~3.4%不等.
其他文献
CET-6 is a nationwide and standardized test to evaluate college students’ English levels. Now more than 10 million college students take part in the exam every
期刊
建立测定蛹虫草发酵液中虫草素含量的高效液相色谱法,对比8株不同产地的蛹虫草液体深层培养液中虫草素的含量。使用XTerra RP18色谱柱,以甲醇与磷酸盐缓冲液(pH值6.8)体积比
该文通过问卷和访谈的形式,对理工科部分大学生的英语快速阅读现状进行了统计和分析,发现理工科大学生的英语快速阅读知识欠缺和能力偏低,并依此提出一些能帮助学生提高英语
数学家庭作业是小学生巩固数学课堂学习成果的重要媒介,家庭作业的质量直接影响着学生复习巩固数学课堂学习成果的效率,农村小学数学教师应慎重斟酌数学作业的内容和形式,帮