论文部分内容阅读
人的语音虽然具有独立性,但也可以被模仿。模仿者蓄意模仿说话人的声音,当相似度较高时,听者很难通过人耳进行辨别,甚至一些身份确认系统也会被蒙骗,这对信息安全造成了很大的危害。因此,对蓄意模仿说话人语音中的特征进行分析并找出与原说话人语音之间的特征参数差异是十分必要的,这在刑侦、国防等方面都有着广泛的应用前景。本文首先介绍了蓄意模仿说话人语音的应用以及识别的研究现状和蓄意模仿的概念,对影响模仿相似度的外在因素进行了分析,并阐述了蓄意模仿说话人语音对信息安全的危害。接着介绍了说话人识别中常用的特征参数,如基音周期、LPCC和MFCC及其动态参数等。在对特征参数研究的基础上,介绍了基于VQ的说话人识别方法,提出了一种计算语音特征参数差异的方法即新的谱距离和最大后验概率矢量量化(VQ-MAP)过程结合的方法,并在说话人识别系统中进行实验,验证了其快速高效的特点。其次,采用对偶比较法对蓄意模仿说话人语音的相似度进行主观评价,利用欧氏距离和新的谱距离的方法计算特征参数的差异。建立蓄意模仿语音库进行实验,首先主观评价蓄意模仿说话人语音的相似度,接着计算几种特征参数的个体内和个体间差异。利用区分原说话人语音和蓄意模仿者语音的原理即原音和蓄意模仿音个体间的距离大于原音个体内和蓄意模仿声个体内的距离来判别特征参数的性能,并把主观评价相似度的排序和特征参数的差异比排序进行对比,分析特征参数的差异是否与主观评价的相似度一致。在此基础上,将不同的特征参数的差异比进行比较,经分析得出蓄意模仿语音中可用于识别的特征参数及其性能。最后,对本文的工作进行总结,并提出下一步的研究方向。