论文部分内容阅读
语音识别技术以语音信号处理为研究对象,让机器来理解人类的自然语言,从而使该技术成为人机交互的接口。目前的语音识别系统在理想工作环境下,识别效果非常好;在高噪声环境下,识别率急剧下降。因此如何提高噪声环境下系统的识别性能对语音识别技术的商用具有重要意义。本文主要研究应用于小词汇量、非特定人、孤立词语音识别系统的语音前端噪声处理过程,主要包括语音信号的去噪过程及后续的不同采样率语音的特征参数提取过程。论文主要研究语音信号噪声去除算法的具体实现及经过去噪后的8KHz与16KHz语音信号的MFCC特征参数提取算法的实现。论文首先研究了基于欧洲电信标准化协会202-050去噪标准协议的语音去噪算法,重点研究了其中用到的频谱估计算法、维纳滤波算法、Mel滤波器及有效语音探测(VAD)算法。在特征提取过程中,由于不同采样率信号的语音组成特点不同,分别研究了针对8KHz及16KHz语音信号的MFCC特征参数提取算法。对8KHz的语音信号采取波形变换、倒谱计算及BlindEquation算法提取出MFCC特征参数。对16KHz的语音信号首先将信号分成高低两个频带,其中低频带的处理过程与8KHz信号的处理过程相同。高频带信号通过编解码及频谱变换等过程得到特征参数,再将高、低频带的参数结合,得到最终的MFCC特征参数。通过上述去噪及特征参数提取算法,在识别语音掺杂进很大的背景噪声情况下孤立词的浮点识别率达到了95%,识别的稳健性有了较大的提高。并将算法从浮点转换为定点,为算法在DSP上实现做准备。