论文部分内容阅读
说话人识别作为生物认证技术的一种,是根据应用语音波形中反映说话人生理和行为特征语音参数,自动鉴别说话人身份的一种技术。与其它生物识别技术相比,说话人识别具有更为简便,经济及可扩展性良好等众多优势,可广泛应用于电话银行,数据库访问,计算机远程登录,安全验证,控制等领域。正因为说话人识别具有如此广阔的应用前景,国内外许许多多的工作者投身于这一领域的研究中。人的声道响应是反映说话人个性特征的重要的物理量。而语音信号中声道响应是和声门激励信息卷积在一起的。为了从语音信号中得到声道响应就必须对语音信号实现解卷积。本文介绍了对语音信号实现解卷积求取倒谱系数的两种方法:线性预测分析和同态分析处理。通过对语音信号进行解卷积,从而获得与声道响应有关的倒谱系数,组成特征向量。说话人识别中有许多先进有效的识别技术,其中高斯混合模型(GMM)由于性能较好、复杂度小、方法简单,是目前最好的说话人识别算法之一。本文介绍了GMM模型的概念、模型参数的估计以及GMM的识别算法,并通过实验研究分析了GMM模型的阶数对识别性能的影响。本文阐述了小波分析理论应用于语音增强的原理,并将基于自适应阈值小波去噪算法应用于说话人识别系统的预处理。实验结果表明,这种方法具有语音增强效果,应用于噪声环境下的说话人识别系统时,能够提高系统的鲁棒性。通过分析当今说话人识别系统中常用的一些特征参数,以提高说话人识别的识别率为目的,研究了将Mel频率倒谱(MFCC)、线性预测倒谱(LPCC)及它们的一阶差分和基音周期等多种特征有效结合进行说话人识别的方法。采用自相关法提取基音周期。经过实验证明,使用多特征有效结合比使用单个特征效果要好,能在一定程度上提高系统区分说话人的能力。