论文部分内容阅读
将支持向量机(SVM)模型应用在说话认识别技术领域,是当前的一个研究热点。SVM是一种区分性模型,适合处理小样本的分类问题,具有很强的分类能力。但在实际环境中,文本无关的说话人识别系统需要较大的语音数据,将SVM直接用于训练模型时,会产生训练速度慢、算法复杂而难以实现和分类结果易受核函数参数影响等问题。本文采用高斯聚类(GMM)方法对大量语音数据进行分类,利用粒子群算法(PSO)对SVM的核函数参数进行优化,有效改善了说话人识别系统的识别性能。针对标准PSO算法容易陷入局部最优的缺点,提出一种改进的PSO算法。本文主要工作如下: 1、前端特征参数提取部分:详细分析了语音端点检测技术、特征选择和特征变换技术。本文提出了谱熵端点检测算法,相对于传统的端点检测算法,即使在信噪比较低的情况下,也能准确的检测出语音信号的始末点。此外,对不同组合的特征参数进行分析,并对选择的合适的特征参数进行高斯聚类,减少SVM的训练量。 2、讨论了两种说话人识别方法:基于PSO优化SVM的说话人识别和改进的PSO优化SVM的说话人识别。利用PSO对SVM的惩罚系数和核函数参数进行优化,相对于标准的SVM,说话人识别系统的识别率得到了提高。针对PSO算法的缺点,对其进行改进,使改进后的算法加快了收敛速度,提高系统识别能力。最后通过Matlab仿真,实验结果表明改进的PSO的识别系统有较高的识别率。