论文部分内容阅读
语音增强是语音处理的一项重要技术,在语音识别、语音编码、语音合成等领域中有着广泛的应用。语音增强的目的是从带噪语音中提取尽可能纯净的原始语音。但由于噪声信号都是随机产生的,完全消噪几乎不可能。因此,实际语音增强的目标主要有:提高语音清晰度,改善语音质量;提高语音可懂度,方便听者理解。目前,常用的语音增强算法有:短时谱估计方法,掩蔽效应方法,子空间方法,小波包方法。本文阐述了基于短时谱估计语音增强算法的基本原理,该算法包括谱减法,最小均方误差方法,维纳滤波方法。仿真结果表明,维纳滤波方法可以更有效的消除音乐噪声。本文描述了子空间语音增强算法的基本原理,该算法包括:基于时域约束估计器(TDC)和频域约束估计器(SDC)的子空间语音增强方法。本文提出了一种基于子空间与维纳滤波相结合的语音增强算法,该算法将维纳滤波方法应用于白噪声背景下的子空间语音增强算法中,仿真结果表明,该算法在白噪声和火车噪声背景下,信噪比都比传统子空间方法有明显提高,并有效抑制了增强后产生的音乐噪声。本文还将基于白噪声背景下的子空间语音增强算法和基于Johnston听觉掩蔽模型的掩蔽效应方法相结合,该方法是利用子空间方法对带噪语音进行增强,并通过基于Johnston掩蔽模型的感知滤波器对语音进行后置滤波,从而得到符合人耳听觉特性的更加纯净的增强语音。仿真结果表明,该方法在复杂背景噪声环境中不仅有效抑制了音乐噪声,得到了较好的增强效果,而且运算量较小,利于实时实现。本文阐述了基于小波包变换语音增强方法的基本原理,该算法采用5阶Daubechies小波对带噪语音进行Bark尺度小波包分解,很好的模拟人耳的听觉特性,并采用新的阈值函数对该方法进行改进。本文提出了一种基于小波包变换和听觉掩蔽效应的语音增强方法,该方法利用小波包变换方法对带噪语音进行增强,通过Johnston掩蔽模型计算噪声掩蔽阈值,并通过基于Johnston掩蔽模型的感知滤波器对增强语音进行平滑,从而得到更加纯净的增强语音。仿真结果表明,该方法较传统小波包变换方法在信噪比和感知语音质量评价PESQ值上都有较大提高,在信噪比较低的情况下,效果更加明显,音乐噪声得到了很好地抑制,取得了较好的增强效果。本文还提出一种子空间与小波包变换相结合的语音增强方法,该方法是在子空间域中,利用小波包变换方法对带噪语音特征值进行滤波,从而得到增强后的纯净语音特征值,通过子空间反变换得到增强语音,仿真结果表明:该方法在增强效果上比传统小波包变换方法有明显提高,并且算法复杂度较低,运算速度较快。