关键词识别系统的设计与实施

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户：liangdd1984

【摘要】

：

关键词识别是语音识别的一个重要分支,综合了信号处理和模式识别等多项技术,应用前景广阔。本文对关键词识别技术的发展现状与主要技术进行了研究,并分别基于两种不同的技术

【作者】

：

谈雪娇

【出处】

：

北京邮电大学

【发表日期】

：

2016年01期

【关键词】

：

关键词识别隐马尔科夫模型韵律特征分段动态时间规整可疑区间快速定位

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

关键词识别是语音识别的一个重要分支,综合了信号处理和模式识别等多项技术,应用前景广阔。本文对关键词识别技术的发展现状与主要技术进行了研究,并分别基于两种不同的技术设计与实现了两个不同的关键词识别系统,分别进行了性能测试与分析。在第二个系统的基础上,进行了创新性改进,较为有效地提升了识别效率。本文的研究重点为关键词识别系统的设计与实施,以及各环节关键技术的分析与应用、针对特定目标的算法设计及应用、以及对设计的算法的有效性分析等。主要工作如下:1.基于填充(Filler)模型的关键词识别技术及系统实现本文对基于填充模型的关键词识别技术进行了研究与系统实现。实现了基于两阶段的模型训练方法,有效的减少了训练语音的人工标注;对LDA技术进行了重点研究及应用,进一步改善了系统性能。2.基于分段DTW的关键词识别技术及系统实现针对基于模型的方法需要大量训练语音,本文对仅需要几个关键词语音样本的基于分段DTW的关键词识别技术进行了研究与系统实现,完成了高斯后验概率特征的提取及模板匹配。3.基于韵律特征的快速关键词识别及系统实现针对基于模型和传统的基于DTW的关键词识别方法,都是逐帧的进行识别和匹配,计算量较大,识别速度受限,本文利用韵律特征的特性,即单个韵律特征可表示连续多帧语音,实现了基于段的关键词可疑区间快速定位,在下一阶段只需对可疑区间进行逐帧的精细化匹配,从而在有效减少计算量的同时保证了识别性能不受影响。该部分对韵律特征在关键词识别中的具体应用进行了重点研究,并完成了算法的设计与有效性分析,以及识别速度和识别性能的折中。最后,对系统的时间开销和识别性能进行了测试及对比分析,证明了该方法可在识别性能不受影响的同时提高整个系统的识别速度。

其他文献

四波混频效应在全光信号处理中的若干应用

在当今的通信网络中,信号的传输主要依靠光纤完成。但是信号的处理,还是主要依靠电来完成,这样就增大了传输成本,也降低了传输效率。全光信号处理技术可以在光域直接对光信号

学位

参量过程全光采样硅基波导波长转换调制不稳定性

基于隐式可信第三方的数据持有性证明算法

随着近年来云存储的发展,越来越多的企业与个人开始认识并使用云存储。由于云存储服务提供商不完全可信,云存储的安全性一直是各界关注的焦点,也成为云存储能否大力发展的关

学位

云存储数据持有性同态认证元客户端开销可信硬件

甘肃省女子劳教所劳动教养对象实证分析

我国劳动教养制度的实施已近六十载,期间,适用劳动教养制度的收容对象数量一直趋于稳定。而今,在劳动教养制度面临废、改情势下更需要多方面的研究,尤其是实证分析。本文以甘

学位

劳动教养适用对象分类治理矫治措施

云存储服务中数据的更新和完整性验证

自从云计算平台提出以来,它的高存储性和高运算性能成功地解决了大数据时代带来的问题。然而,因为用户把数据远程的存储在云端,失去了对数据信息的控制能力,所以云端数据的完

学位

云计算完整性验证动态更新自主审计

语者识别系统快速匹配机制的设计与实施

尽管说话人识别系统在识别结果上已经取得了令人满意的结果,但是随着人口规模的不断增大,传统的GMM模型的识别时间也越来越长,识别速度慢将大大限制说话人识别系统的实用性。

学位

说话人识别GMM-UBM说话人模型聚类K-means算法初始聚类算法

增强自主创新能力建设高水平创新型国家

党的十九届五中全会明确提出:"坚持创新在我国现代化建设全局中的核心地位,把科技自立自强作为国家发展的战略支撑,面向世界科技前沿、面向经济主战场、面向国家重大需求、面

期刊

大企业集团高层次人才创新型国家原始创新共性技术科技资源配置公共技术平台综合服务体系高新技术技术创新活动产学研相结合企业为主体侵犯知识产权

全局与局部特征融合的大规模图像检索方法

大数据时代下,随着互联网中大规模图像数据库越来越多,如何使用户快速的在海量、动态的数据库中找到满足需求的图像是现今视觉领域的重要课题。其中,最主要的应用是基于内容

学位

二维倒排索引词袋模型全局特征局部特征权值估计

高速PON信道编码技术研究

无源光网络(PON)以其低成本、高带宽和性能稳定的优点成为一种主流的宽带接入技术。随着PON系统速率的提升,需要使用编码增益更高的前向纠错编码(FEC)来改善PON系统的功率预

学位

无源光网络前向纠错编码准循环低密度奇偶校验码码率自适应

EPG系统数据传输安全性的研究

伴随着我国数字电视技术的快速发展,EPG(ElectronicProgram Guide),即电子节目导航系统孕育而生,它已经衍变成数字电视一项不可或缺的基础性业务。从功能来讲,它是电视和用户

学位

电子节目导航系统文件监听SHA-1算法完整性验证

语声分割机制的设计与实施

语声分割机制在很多应用方面均占有重要的地位,比如多媒体音频检索、说话人聚类、说话人跟踪等。例如,当语声分割机制与说话人聚类结合,可形成完整的说话人检测与跟踪系统,有

学位

语声分割机制语音端点检测说话人切换点检测特征提取

关键词识别系统的设计与实施

与本文相关的学术论文