论文部分内容阅读
作为一种基于生物特征信息的身份识别方法,说话人识别通过语音来识别说话人的身份,具有极大的应用价值和广泛的应用前景。说话人识别系统对纯净语音可以达到很高的识别率,但是在噪声环境下,系统的性能将会急剧下降。语音增强是解决该问题的主要方法,对带噪语音进行语音增强处理后,能使系统保持较高的识别率。因此,研究语音增强技术具有重要意义。语音增强一般作为说话人识别系统的预处理或者前端处理模块存在,其目的是从带噪语音信号中提取尽可能纯净的原始语音。由于噪声信号的来源复杂且特性各不相同,必须根据不同的噪声,采取特定的语音增强策略。本文主要针对加性宽带噪声,较深入地研究了基于短时谱估计的语音增强算法,对它们进行了探讨验证和改进,主要工作包括以下几个方面:①在端点检测方面,比较了几种常用能量特征的优劣。通过引入对数能量并调整阈值,对传统的基于短时能量和短时过零率的端点检测方法进行了改进,并通过实验验证了改进方法的有效性。②研究了基于短时谱估计的语音增强方法,包括谱减法、维纳滤波法和最小均方误差法。介绍了上述语音增强方法的基本原理、实现方法和改进算法。通过对以上方法的系统分析,总结出各方法的优缺点。详细分析了基于短时谱估计的语音增强方法的通用形式,并对以上方法进行了计算机仿真实验。③对传统的估计噪声功率谱的方法进行改进,在此基础上提出一种改进的基于先验信噪比估计的维纳滤波语音增强算法。从理论上进行了推导,并通过实验验证了该算法的有效性。④在深入探讨了语音增强算法的基础上,本论文将语音增强技术作为说话人确认系统的前端处理模块,设计并实现了抗噪声的说话人确认系统。