论文部分内容阅读
噪声是阻挡语音识别走向实用化的主要因素。为了使语音识别产品能够更好地走向实用,提高在噪声环境下的语音识别率成为当前迫切需要解决的问题。本文在研究国内外相关资料的基础上,对噪声环境下的语音识别进行了以下关键技术研究。语音预处理技术直接影响特征提取的好坏和语音识别的正确率。本文对语音信号的预处理技术进行研究,包括语音增强、预加重、分帧、加窗以及端点检测技术等噪声去除方法。本文对噪声和语音的自动分离技术进行分析,包括盲分离算法、独立分量分离法、基于遗传算法的独立分量分离法。在此基础上,提出了基于禁忌搜索的盲分离算法。搜索过程中使用禁忌搜索学习方法,以峭度作为分离矩阵的适应度,并根据基音频率选取出所需的语音信号。实验表明基于禁忌搜索的语音分离算法能够跳出局部最优,搜索到全局最优分离矩阵,将语音信号与噪声信号进行有效分离,为语音识别的后续工作打好基础。提取具有抗噪性能的特征参数是语音识别的关键。本文将具有抗噪性能的Teager-Kaiser能量算子与符合人耳听觉的Gammatone滤波器相结合,提取一种语音特征参数TECC,并采用能较好反映语音信号动态特性的差分参数,提出将TECC参数与差分TECC参数相结合,形成组合TECC参数(TECC+△TECC)。实验结果表明所提的特征参数与传统语音特征参数LPCC、MFCC及其组合MFCC参数(MFCC+△MFCC)相比具有更好的抗噪性能和识别效果。本文采用Matlab开发工具,实现了一个小词汇量语音识别系统,并介绍了系统实现方法。