论文部分内容阅读
说话人识别技术是利用语音所包含的说话人特有的个性特征,自动进行身份认证的过程,因其具备经济性、非接触性、普适性和可区分性等天然优势在众多生物认证技术中独树一帜。现有的说话人识别技术在理想环境下识别效果良好,但在实际应用中,复杂环境使得训练和识别语音特征失配,系统识别性能急剧下降。如何有效提高识别系统的鲁棒性成为该技术的重点和难点。稀疏分解作为信号处理领域一个重要的理论分支,被广泛应用于信号去噪、压缩编码、参数估计、信号时频分析和盲源分离等诸多方面。本文基于信号的稀疏分解理论,研究不同噪声背景下语音信号的去噪问题,给出相应的语音信号去噪方法;同时将基于稀疏分解的去噪方法用于说话人识别系统的预处理环节,分析其对系统识别性能的影响。本文主要工作如下:1.搭建基于矢量量化的说话人识别系统。首先简要介绍系统的构成;然后,根据系统实现的具体步骤对系统各部分逐一介绍,对其中关键步骤——特征提取和模板训练与识别进行了详细的分析;最后,通过仿真实验,调试出系统达到最佳识别率时的各项参数。2.研究稀疏分解理论在语音信号去噪中的应用。给出信号的稀疏表示和信号重构算法,并重点介绍了一种与本文密切相关的凸松弛重构算法——基追踪算法;同时,对语音信号在不同基底上稀疏分解,选定稀疏度最佳的DCT基作为本文的稀疏表示基,并将基于DCT的稀疏分解应用于语音信号的去噪处理中,仿真实验表明,在低信噪比时,基于稀疏分解的去噪方法可以有效提高重构语音信号的帧平均信噪比。3.分析不同噪声背景下,基于稀疏分解的语音去噪方法对说话人识别系统性能的影响。说话人识别系统预处理环节中使用的去噪方法由噪声方差的有界性决定。对于方差有界的两种典型宽带噪声——均匀噪声和高斯噪声,采用基于DCT稀疏分解的去噪方法;对于方差无界的对称α稳定分布冲击噪声,采用基于联合时频字典稀疏分解的去噪方法。仿真实验表明,这两种方法在低信噪比/广义信噪比时,可显著提高说话人识别系统的识别率。