关键词识别系统的设计与实施

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:liangdd1984
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
关键词识别是语音识别的一个重要分支,综合了信号处理和模式识别等多项技术,应用前景广阔。本文对关键词识别技术的发展现状与主要技术进行了研究,并分别基于两种不同的技术设计与实现了两个不同的关键词识别系统,分别进行了性能测试与分析。在第二个系统的基础上,进行了创新性改进,较为有效地提升了识别效率。本文的研究重点为关键词识别系统的设计与实施,以及各环节关键技术的分析与应用、针对特定目标的算法设计及应用、以及对设计的算法的有效性分析等。主要工作如下:1.基于填充(Filler)模型的关键词识别技术及系统实现本文对基于填充模型的关键词识别技术进行了研究与系统实现。实现了基于两阶段的模型训练方法,有效的减少了训练语音的人工标注;对LDA技术进行了重点研究及应用,进一步改善了系统性能。2.基于分段DTW的关键词识别技术及系统实现针对基于模型的方法需要大量训练语音,本文对仅需要几个关键词语音样本的基于分段DTW的关键词识别技术进行了研究与系统实现,完成了高斯后验概率特征的提取及模板匹配。3.基于韵律特征的快速关键词识别及系统实现针对基于模型和传统的基于DTW的关键词识别方法,都是逐帧的进行识别和匹配,计算量较大,识别速度受限,本文利用韵律特征的特性,即单个韵律特征可表示连续多帧语音,实现了基于段的关键词可疑区间快速定位,在下一阶段只需对可疑区间进行逐帧的精细化匹配,从而在有效减少计算量的同时保证了识别性能不受影响。该部分对韵律特征在关键词识别中的具体应用进行了重点研究,并完成了算法的设计与有效性分析,以及识别速度和识别性能的折中。最后,对系统的时间开销和识别性能进行了测试及对比分析,证明了该方法可在识别性能不受影响的同时提高整个系统的识别速度。
其他文献
在当今的通信网络中,信号的传输主要依靠光纤完成。但是信号的处理,还是主要依靠电来完成,这样就增大了传输成本,也降低了传输效率。全光信号处理技术可以在光域直接对光信号
随着近年来云存储的发展,越来越多的企业与个人开始认识并使用云存储。由于云存储服务提供商不完全可信,云存储的安全性一直是各界关注的焦点,也成为云存储能否大力发展的关
我国劳动教养制度的实施已近六十载,期间,适用劳动教养制度的收容对象数量一直趋于稳定。而今,在劳动教养制度面临废、改情势下更需要多方面的研究,尤其是实证分析。本文以甘
自从云计算平台提出以来,它的高存储性和高运算性能成功地解决了大数据时代带来的问题。然而,因为用户把数据远程的存储在云端,失去了对数据信息的控制能力,所以云端数据的完
尽管说话人识别系统在识别结果上已经取得了令人满意的结果,但是随着人口规模的不断增大,传统的GMM模型的识别时间也越来越长,识别速度慢将大大限制说话人识别系统的实用性。
党的十九届五中全会明确提出:"坚持创新在我国现代化建设全局中的核心地位,把科技自立自强作为国家发展的战略支撑,面向世界科技前沿、面向经济主战场、面向国家重大需求、面
大数据时代下,随着互联网中大规模图像数据库越来越多,如何使用户快速的在海量、动态的数据库中找到满足需求的图像是现今视觉领域的重要课题。其中,最主要的应用是基于内容
无源光网络(PON)以其低成本、高带宽和性能稳定的优点成为一种主流的宽带接入技术。随着PON系统速率的提升,需要使用编码增益更高的前向纠错编码(FEC)来改善PON系统的功率预
伴随着我国数字电视技术的快速发展,EPG(ElectronicProgram Guide),即电子节目导航系统孕育而生,它已经衍变成数字电视一项不可或缺的基础性业务。从功能来讲,它是电视和用户
语声分割机制在很多应用方面均占有重要的地位,比如多媒体音频检索、说话人聚类、说话人跟踪等。例如,当语声分割机制与说话人聚类结合,可形成完整的说话人检测与跟踪系统,有