论文部分内容阅读
语音识别是语音信号处理的一个重要研究方向,它的目的是实现人与机器之间的无障碍沟通。当前的语音识别系统在试验条件下通常都能取得优良的效果,但在将其应用到实际中时性能会骤然下降。本论文以提高语音识别系统性能为研究重点,对噪声环境下语音识别技术的关键技术作了深入探讨。论文首先介绍了语音识别的基本概况、对课题研究意义进行了说明,并对语音识别原理进行了分析;针对噪声环境中语音识别率较低的状况,论文对语音增强算法进行研究,分析了几种常用的语音增强算法:谱减法、自适应抵消法、小波阈值法等,并提出一种基于Hilbert-Huang变换的语音增强方法,该方法根据经验模态分解得到不同基函数分量,自适应调节门限阈值实现去噪,通过仿真试验说明该方法的优点。接下来,论文分析了特征参数提取算法,总结分析了当前比较流行的几种特征参数提取算法,对线性预测系数、感知线性倒谱系数及Mel频率倒谱系数的原理、实现流程作了详细介绍,通过试验比较这几种系数的优劣。最后论文对语音识别中的匹配算法进行研究,介绍了三种匹配算法:矢量量化法、动态时间归正技术及隐马尔可夫模型。前两种技术在孤立词、小词汇量语音识别系统中都取得良好效果,但在大词汇量连续语音识别系统中隐马尔科夫模型更具优势。针对大词汇量语音识别计算负担过重的问题,将Viterbi算法与Beam剪枝技术相结合,在识别率基本不受影响的情况下,大大压缩了搜索空间,减小计算负担,并提出一种优化剪枝门限方法,通过试验证明该方法的可行性。