论文部分内容阅读
对目标人进行身份辨别在人们的日常生活和工作中都时有出现。近年来,说话人识别技术已经在安全加密、银行信息电话查询服务等方面得到了很好的应用,甚至扩展到了司法领域,比如法庭取证。它以目标人的声音作为生物特征,被认为是最方便,最经济的生物认证技术,具有广泛的应用前景。在大多数实际场合,人们不可能事先得到说话人的讲话内容,因此与文本无关的说话人识别更具现实意义,但同时难度也较大。 文章从语音信号处理的共性技术出发,首先介绍了语音信号产生的线性模型、数字化、预处理以及特征参数提取。详细分析了两类主流特征参数LPCC与MFCC的提取过程与特点,并通过求取MFCC参数的一阶差分来进一步挖掘说话人语音中隐藏的动态信息。 关于具体的识别模型,本文研究了矢量量化(VQ)和支持向量机(SVM)在说话人识别中的应用。为了进一步提高识别率,提出结合了协方差矩阵(CM)的VQ模型和VQ-SVM模型二层次识别的新融合策略,并通过Matlab仿真比较分析了不同参数设置下不同模型的识别效果,证明了改进的有效性。 最后采用经典的VQ模型,对说话人识别SOPC系统的实现进行了设计。分析了在系统设计过程中遇到的问题及相应的解决办法,为今后进一步开展研究和在片上系统的实现打下了基础。