论文部分内容阅读
在现实社会的生产实践中,在语音信号的生成、传输和接收各个阶段都会受到背景噪声不同程度的干扰和影响。这些噪声影响人们正常的接收语音信号,对语音处理系统产生抑制作用。为了提高语音信号的质量,我们利用语音增强技术对带噪语音信号进行语音增强,目的在于还原纯净语音信号,提高语音的可懂度。论文研究了短时谱估计语音增强算法中的谱减法和最小均方误差估计算法,并对这两种算法进行了进一步改进。传统谱减语音增强算法的一个主要缺陷就是增强后的语音信号会残留明显的“音乐噪声”,针对这一不足我们采用多频带分解法对其进行改进。改进算法的原理是将带噪的语音信号按照频率划分成不同的频带,并使这些频带之间互不交叠,而后根据频带内带有噪声的语音信号和噪声信号信噪比,利用自适应算法计算得出这个频带的过减因子。分析了最小均方误差估计(MMSE)算法,并根据传统算法,结合语音感知特性,将最大似然估计应用到对数谱域中对算法进行改进,技术关键在于对每帧信号重新做最大似然估计,并将两个可以动态调节的参数和β引入估计式中,增加了算法的灵活性。最后对改进算法进行实验仿真,分析了仿真的结果以证明改进算法的有效性,语音信号在增强过后残留的“音乐噪声”减小,提高了语音的可懂度,信噪比增大,特别是改进的MMSE算法针对白噪声的消噪效果最为明显。