噪声环境下的语音识别方法研究与改进

来源 :江苏科技大学 | 被引量 : 5次 | 上传用户:zmyz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科学技术的发展和计算机的普及,人们对于计算机的交流方式提出了更高的要求,这促进了语音识别技术的发展,并使之成为语音处理领域中的一个重要研究方向。语音识别从研究至今已经取得了很大的进展。目前,在实验室环境即无噪声干扰的环境下,语音识别系统的识别率已经达到了很高的水平,但在噪声环境下识别性能会大幅下降,主要原因就是噪声的干扰使得训练模版与待识别模版不匹配,从而造成识别率的下降。因此,噪声是语音识别技术广泛实用化的最大障碍,对噪声环境下语音识别系统的研究也就变得尤为重要。本文主要研究了白噪声环境下的语音识别技术,介绍了语音识别的基本原理及系统的各个组成部分包括预处理,端点检测,特征参数提取,模式识别与匹配等。目前抗噪技术主要有三种:语音增强,抗噪语音特征提取,抗噪语音模型参数调整。随着语音识别抗噪声技术的研究及发展,如何在实际的语音识别系统中将以上的技术合理地结合起来,使语音识别系统在不同的噪声环境中均能达到较高的性能,是抗噪声语音识别研究的一个重要方向。本文研究的重点是预处理阶段和特征参数提取阶段语音识别的抗噪问题。小波变换不论在时域上还是在频域上都具有良好的局部信号分析能力,它是一种较好的信号分析方法,并且广泛应用于信号去噪等多个领域。本文引入了小波分析方法,详细研究了小波变换理论,分析了小波变换的特点,着重研究了小波阈值去噪方法。本文着重研究了两种抗噪方法:语音增强方法和抗噪语音特征参数提取方法。给出将两种方法相结合的抗噪方法,该方法的基本原理是:首先,在语音识别系统的前端增加语音增强部分,针对传统阈值去噪方法存在的问题,给出一种新的阈值去噪方法,并通过Matlab仿真验证了该去噪方法的有效性。其次,在语音特征参数提取阶段,本文给出一种新的基于小波变换的抗噪语音特征参数—TDWTMFCC特征参数,并将其与DWTMFCC参数相结合,用于语音识别特征参数提取。本文将上述改进过的两种抗噪方法(语音增强法和特征参数提取方法)相结合应用于一个非特定人、小词汇量的语音识别系统中,通过Matlab仿真实验对比验证了该组合去噪方法的有效性。
其他文献
随着嵌入式系统,网络技术和计算机视觉技术的不断发展,未来我们将实现:在任何地方,任何时间,通过任何一种网络访问方式,实现一种或多种的现实智能需要操作。老龄化社会的到来
随着科学技术的不断发展和自动化水平的不断提高,现代机械设备日趋大型化和复杂化。传统的故障诊断专家系统由于受到自身的瓶颈束缚已经难以胜任现代设备故障诊断的任务。现在
风力发电是当今世界增长最快的可再生能源发电方式,我国的风力发电近几年得到了迅猛的发展。由于风电具有较强的随机性和波动性,大规模的风电并网会对电力系统的安全、稳定运行
学位
随着的电力电子技术的不断发展,人们对交流调速系统的性能要求越来越高,矢量控制与直接转矩控制是主流的两种控制方式。矢量控制调速范围宽,动态性能好,但是受电动机参数变化影响较大,直接转矩控制正好能够弥补矢量控制这点不足,且控制结构简单,能实现更快速的转矩响应,这使得它更适合于牵引等大功率应用场合。同时,为保证安全,大功率应用中开关频率普遍较低,这就促进了在低开关频率下对直接转矩控制的研究。本文主要在低
随着科技的进步以及物联网的迅速发展,智慧城市的建设得到全球范围内的关注,城市管网系统作为智慧城市基础设施的重要组成部分,对智慧城市的建设具有决定性的作用。而传统的管网
说话人识别作为生物识别的一种,因其使用便捷性、非交互式等优势逐渐被人们接受和使用,并成为生物识别领域的研究热点。与文本无关的说话人识别是从语音信号中提取出能反映个人
脉搏信号蕴含着丰富的人体生理病理信息,是表征人体生理状况的重要参数。传统的脉搏诊断缺乏客观性,为了促进脉诊的客观化,研制了双目视觉脉搏图像采集系统,该系统基于视觉测
慢性病严重威胁着人类的健康,近年来我国对慢性病的防控也愈发重视,心脑血管疾病作为慢性病的代表也引起了人们越来越多的重视。对心脑血管疾病患者的体征信号需要进行长时间
随着计算机视觉技术的飞速发展,图像成为了一种重要的信息传递媒介,人们从互联网上获取丰富图像资源并凭借此来认识理解世界,不同的人们对于图像的理解也越来越趋于多样化,而