论文部分内容阅读
该文首先叙述了声纹识别的基本概念、分类、优点、难点以及它在国内外的应用情况.声纹识别是语音识别的一个分支,语音识别分为语音内容的识别和说话人识别,声纹识别属于说话人识别.声纹识别是一项根据语音波形中反映说话人生理和行为特征的语音参数,自动识别说话人身份的技术.近年来,声纹识别技术以其独特的方便性、经济性和准确性等优势也受到世人瞩目,在互联网和通信领域有广泛而重要的应用价值,并日益成为人们日常生活和工作中重要的安全验证方式.文章接下来讲述了声纹识别的原理.声纹识别系统主要包括两部分,即特征提取和模式匹配.特征提取的任务是选取唯一表现说话人身份的有效且稳定可靠的特征,模式匹配的任务是对训练和识别时的特征模式做相似性匹配.目前研究的表征个人特性的特征参数有很多,但没有一种特征参数在各种条件下都是很好的.接下来是该文的核心部分,重点介绍了线性预测倒谱系数和矢量量化方法.并且从理论上分析了倒谱具有较好的分离声道特性的性质,是反映个人特征的一个好参数.该文提出了平均互—自差异比的概念,给出了一种对特征矢量的每一维分量的识别能力进行定量化的公式.并通过实验得出结论:16阶的线性预测倒谱系数的每一维参数对声纹识别都是有效的,只是从第6阶至第16阶特征分量的有效性更大,利用这个特性可以提高识别系统的实时反应速度.该文还从理论上分析了矢量量化建模方法的可行性和不足之处,并提出了一种算法用方差去弥补这种不足.通过实验得出结论:矢量量化建模方法具有分类准确、存储数据量小、实时响应速度快的优点.而且用方差修正的矢量量化则能更好地刻化帧在特征空间分布的精细结构,从而提高系统的识别率.该文还给出了一些实验数据论证作者的一些观点.在文章的最后部分,作者对声纹识别的研究提出了一些值得进一步研究的课题,并且对声纹识别的前景进行了美好的展望.