基于深度学习的语音识别方法研究

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:Michael_Wong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音识别技术主要包括连续语音识别和关键词识别,它在人机交互、网络聊天、车载导航、机器人、智能家居、智能终端等领域具有广泛的应用。传统的基于隐马尔科夫模型的语音识别技术已经取得重要进展,并得到一定应用,但其识别效果较差,难以实现人与机器人之间的智能交互。此外,在嵌入式语音识别中,由于处理器内存、计算能力等限制,其语音识别性能有限,难以满足实际应用要求。为此,本文应用深度学习方法,研究了连续语音识别和关键词识别技术,主要研究工作包括如下:(1)研究了基于隐马尔科夫模型和时延神经网络的连续语音识别技术,采用训练好的模型进行在线语音识别系统搭建,在Kaldi平台上改进了CVTE模型的解码器,取得了良好的识别效果和良好的解码效率。(2)研究了一种基于通道重排卷积神经网络的关键词识别方法。该方法通过组卷积和通道重排操作,减少了常规卷积操作的参数量和计算量;通过调整模型结构,该关键词语音识别方法获得了良好的识别准确率,且对于参数量较小的模型,增大分组数,可提高识别率。实验结果验证了在不同模型尺寸限定下该模型的有效性。(3)对于关键词识别任务,研究了一种基于反向残差卷积神经网络的关键词识别方法,该方法采用了深度分离卷积和反向残差网络结构,在参数量保持不变的条件下,提升了语音识别性能。在此基础上,对反向残差卷积神经网络进行改进,提出了一种基于通道重排和反向残差的卷积神经网络模型结构,该模型结构将反向残差网络中的卷积层替换为组卷积和通道重排,进一步减少了参数量和计算量,实验验证了在不同模型尺寸限定下该模型的有效性。
其他文献
目的研究小鼠涂抹珍珠护肤品后对皮肤的抗衰老作用.方法小鼠分别于用药后第15、30、45 天时,颈椎脱臼处死小鼠,测定等同面积皮肤重量及其羟脯氨酸的含量.结果用药15 d时,皮肤
舰艇抗冲击能力是提高舰艇生命力和战斗力的重要组成部分.本文广泛搜集了国内外舰艇管道系统抗冲击技术方面的文献资料,并进行了归纳与整理,从舰艇管道系统冲击分析方法、数
分析了离心泵振动的原因,通过一个实例介绍了解决离心泵振动的方法并提出了预防离心泵振动的措施。
<正>内部控制是企业对自身经营发展的自我约束,在当前经济下滑、市场全球化的外部环境以及企业管理转型的内部环境下,如何保障企业经营的稳定已然成为企业关注的重点。在企业
<正>异物挂线已成为威协输电线路安全运行的极大威协。运行部门常规采用地电位法处理,但该法受异物位置、线路周边地形地貌限制较大;如果停电处理,则影响输电可靠性;如果采用
近年来,伴随着我国区域一体化向纵深推进,区域协同治理面临着合法性困局、统一性困局、公平性困局及利益博弈困局。本文从公共行政学视角入手,认为我国区域协同治理的实现必
目的探讨品管圈活动对降低电子护理病历缺陷率的效果。方法成立品管圈活动小组,确立"降低电子护理病历缺陷率"为活动主题。活动前对我科100份(运行病历50份,出院病历50份)电
本文根据我国教育方针和当前国家在转变教育思想、教育观念及开展素质教育等方面的系列精神,在总结大连水产学院淡水渔业和海水养殖专业20余年的办学经验和研讨水产养殖本科专业
对车身涂装工艺过程中存在的缺陷问题进行分析,以求找出问题的根源,为涂装的外观品质提高提供依据,并对涂装的品质控制创造条件。
目的:对银汞桩核用于磨牙修复进行临床观察和分析。方法:通过对103例行银汞桩核修复的磨牙进行七年回顾性研究,观察其预后。结果:103例修复体中有7例失访,随访的96例均为Ⅰ级