论文部分内容阅读
语音常常受到背景噪声的干扰而使语音质量下降。在这种情况下,我们可以使用语音增强技术抑制背景噪声,提高语音质量。
语音增强的方法有很多,其中谱减法由于原理简单、运算量小,得到广泛应用,但是它在抑制背景噪声的同时会产生“音乐噪声”。因此本文主要围绕如何抑制“音乐噪声”展开研究,并完成以下工作:
◆本文分析了Doblinger和Cohen噪声谱估计方法的优点和不足,并在他们的基础上提出了一种快速自适应的噪声谱估计方法。实验证明,该噪声谱估计方法解决了背景噪声突变情况下,Cohen噪声谱估计方法中估计噪声谱的延时问题,并且还提高了估计噪声谱的准确性。
◆本文分析了平滑的先验信噪比曲线能够抑制“音乐噪声”的原理,然后从先验信噪比的定义出发,提出了一种有效的先验信噪比平滑方法。实验证明,本文方法解决了直接判决法在语音开始端能量较大情况下,先验信噪比的延时问题;同时结合该方法实现的基于小波阈值多窗口功率谱估计的语音增强方法能够有效抑制“音乐噪声”,但它是以增大语音失真为代价的,其中辅音和能量较小的元音共振峰损失较大。
◆本文提出了基于先验信噪比和人耳听觉掩蔽效应的语音增强方法。基于先验信噪比和人耳听觉掩蔽效应的语音增强方法是在Virag方法的基础上,使用先验信噪比进一步细化调节频谱衰减因子中的噪声谱权重系数。实验证明,相比Virag方法,该语音增强方法在不增大语音失真的前提下,进一步抑制了“音乐噪声”;相比基于小波阈值多窗口功率谱估计的语音增强方法,该语音增强方法在抑制“音乐噪声”的前提下,进一步减小了语音失真,尤其是辅音和能量较小的元音共振峰损失明显减小。