论文部分内容阅读
说话人识别技术因其独特的方便性、经济性和准确性,在生物特征识别领域中具有广阔的应用前景。现有的说话人识别技术在理想条件下效果很好,但在实际环境中却由于各种因素的影响,识别效果明显下降。因此如何提高识别系统的鲁棒性已经成为本领域的研究热点。说话人识别系统的鲁棒性问题涉及系统的各个部分。本文从语音传输过程中的丢包补偿、训练数据不足和噪声下的说话人建模技术等几个方面进行了研究,取得了以下进展:1.提出了一种基于lagrangian插值的分组恢复方法。这种补偿方法在丢包率较小,且不是连续丢包的情况下效果比较好。但是当丢包率比较大时这种补偿方法的效果就不理想了。基于lagrangian插值的分组恢复方法对丢失帧的实际位置进行了估计,比传统的分组恢复方法有更好的效果。2.改进了GMM识别算法,提出了一种基于GMM-DM的识别算法。通过引入DM距离,即以测试语句与模板的之间的相似性测度,来修正GMM模型在训练数据不充分的情况下的识别结果,GMM-DM方法在训练数据不充分时对GMM判决结果进行修正,进一步克服了数据丢失对系统识别率的影响。3.研究了子带识别技术在说话人识别的应用。由于子带信号相对于宽带信号来说变化比较缓慢,因此数据模型相对比较简单。本文主要研究了在不同信噪比的加性白噪声和NOISEX-92噪声数据库中的真实噪声环境下,子带技术对说话人识别系统鲁棒性的提高。我们采用从子带提取特征参数的方法,提取出子带上携带的语音信息,利用噪声能量分布进行加权,并结合GMM-DM识别算法,对多子带GMM系统的信息进行融合判决,以提高系统的鲁棒性。