论文部分内容阅读
说话人识别技术是近几年发展起来的计算机安全技术之一。说话人识别又称声纹识别,是依据说话人声音的特色、说话的习惯等个性特征识别不同的说话人。随着社会的快速发展,它广泛应用于考勤系统、安全控制和金融安全等领域。本文的内容是研究与文本无关说话人识别的算法和在DSP上实现该算法的门禁系统。本文的说话人识别算法采用了美尔倒谱参数和矢量量化技术。对于特征参数的选取,采用了充分考虑人耳的听觉特性的美尔倒谱参数。对于模式匹配技术,本文选用矢量量化技术,矢量量化是一种效率非常高的编码技术。当可用于训练的数据量较小时,基于矢量量化的方法比其他的方法有更大的鲁棒性。同时,基于矢量量化的方法比较简单,实时性也较好。因此,直到目前为止,基于矢量量化的说话人识别方法,仍然是最常用的识别方法之一。本文在Matlab环境中对基于动态时间规整和矢量量化技术的说话人识别进行对比,实验的结果得出矢量量化技术用于与文本无关的说话人识别效果要好于动态时间规整,故模式匹配技术选取矢量量化。对于门禁系统的实现上,整个系统包括三个部分,语音的采集、语音信号的存储和相关信息的显示。硬件主要基于TI公司的数字信号处理器TMS320VC5509、音频编解码器TLV320AIC23、片外SDRAM存储芯片和液晶显示模块。在此基础上的工作有:使用TLV320AIC23对语音信号进行采集;通过McBSP将采集的数字语音信号传送给TMS320VC5509;在TMS320VC5509上实现语音信号特征参数的提取及其识别算法;识别的最终信息通过液晶显示屏显示,并且发出相应的控制指令。