音素识别技术研究与应用

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:losches
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
音素是根据语音的自然属性划分出来的最小语音单位,而音素识别技术是一种从语音音频中识别出其音素序列的模式识别技术。音素识别已经历经了几十年的发展,从传统的隐马尔可夫模型到现在的基于注意力机制的编解码模型,音素识别技术日趋成熟,识别性能已经提升到了一个很高的水平。需要进一步明确的是,音素识别技术可以作为一项支撑技术,其合理应用可以较为有效地提升其它系统的性能。本论文重点进行了两方面的研究,其一是端到端音素识别技术的改进和优化,其二是音素识别技术在按例查询型关键词检测系统中的应用。针对这两个研究方向,本论文所完成的主要工作可以归纳为如下三个方面:1.本论文对基于编解码模型的端到端音素识别技术进行了研究和优化。论文中对融入注意力机制的编解码模型进行了系统实现,同时创新性地使用了 Word2vec系统对原有系统中Embedding机制进行了改进。此外为了弥补训练数据不足的问题,论文中设计了一种基于逆映射思想的数据增补方法;同时,在系统开发过程中引入了纠正训练步骤,能够有效提升音素识别系统。2.论文中创新性地使用音素识别技术来生成关键词检测系统的特征,并依托图像识别技术完成了按例查询型关键词检测系统的开发。本论文利用上述音素识别系统来提取音素向量特征,之后利用相关性计算将音素向量特征转化为特征图像,进而使用基于深度学习的图像识别技术完成特征图像的处理,最终完成了关键词的按例查询。本论文经过系统性能实验,证明了该系统具有可行性。为了评估所开发系统的性能,本论文还设计了一个使用音素后验概率谱来生成特征图像的对比方案。该对比系统采取了多层感知机的音素识别技术来生成关键词检测所需要的音素后验概率谱,然后结合图像识别技术来进行关键词检测。本文经过系统性能实验,能够达到预期的实验效果,并通过两种系统的性能对比,证明了基于音素向量的关键词检测系统性能要优于基于后验概率谱的系统。3.本论文所完成的音素识别系统的基础上,利用模板匹配思想进一步设计和实现了一个按例查询型关键词检测系统。该系统借鉴了 D-vector说话人识别算法中的思想,依托上述音素识别系统生成关键词检测系统的摘要特征,然后利用基于滑动窗的模板匹配方法,在待测数据中确定关键词的存在并能够定位其所在位置。经过系统性能实验,该系统能够达到预期的性能效果。同时本文把该模板匹配系统和前两个基于图像识别技术所搭建的关键词检测系统做了系统性能对比,并分析了系统之间的差异。
其他文献
目的 对膝关节前交叉韧带(ACL)及半月板损伤患者进行MRI诊断,评价其临床诊断价值.方法 选取2019年3月至2021年3月医院收治的膝关节损伤患者94例进行回顾性分析,所有患者均进行MRI检查与关节镜检查,以后者检查作为金标准,对MRI检查诊断膝关节ACL损伤、半月板损伤的临床价值进行评价分析.结果 MRI诊断膝关节ACL损伤的灵敏度、特异度、准确度分别为95.35%、87.50%、94.68%,Kappa值为0.731.MRI诊断半月板损伤的灵敏度、特异度、准确度分别为93.98%、90.91%、9
近年来,全球汽车保有量的不断增加对交通安全和道路智能化水平提出了更高的要求。一方面,车载毫米波雷达被越来越多地用于各种驾驶辅助系统和碰撞避免系统中,成为车载传感器中最为重要的组成部分之一;另一方面,车联网中的车对车(Vehicle-to-vehicle,V2V)通信技术无需依赖路边基础设施单元(Roadside Unit,RSU),可为移动中的车辆节点直接提供端到端的无线通信服务,潜在地补充车载感
目的 探讨肌骨超声精准引导下增生疗法治疗冈上肌肌腱病的临床效果.方法 选取本院2019年5月至2020年12月收治的60例冈上肌肌腱病患者.依据随机数字表法分为对照组与观察组,每组30例患者,对照组采用经冲击波治疗,观察组采用增生注射疗法.比较两组患者影像学评定、肩关节功能等指标.结果 察组治疗后美国肩肘医师协会(ASES)评分、加州大学肩关节ULCA评分、VAS评分[分别为(91.78±6.42)分、(31.47±2.04)分、(1.25±0.83)分]均优于对照组[分别为(85.34±4.92)分、(
目的 探究腹腔镜下胃大部切除术中应用镇痛指数(PTi)指导瑞芬太尼靶控输注的麻醉效果以及对应激反应的影响.方法 选取本院于2018年1月至2020年12月收治的行腹腔镜下胃大部切除术患者62例临床资料,按麻醉方式分为对照组和观察组,各31例.对照组采用持续静脉泵入瑞芬太尼维持麻醉,观察组根据PTi指导瑞芬太尼血浆浓度,维持PTi处于40-60范围,对比上述两种麻醉方式的安全差异性.结果 观察组瑞芬太尼使用量、苏醒时间、拔管时间、β-EP、AngⅡ和ACTH水平均低于对照组(P0.05).结论 PTi指导瑞