论文部分内容阅读
耳语音说话人识别在公共场合下的通讯,安全场所的身份鉴定以及罪犯识别,电话网络查询与电话银行等领域都有着广泛的实用价值。耳语音的说话人识别技术在日常生活中越来越被重视。由于耳语发音方式的特殊性,耳语音说话人识别受说话人的健康状况、心理变化、发音状态和信道环境等因素的影响尤为突出。用正常音建立的说话人识别系统应用到耳语音,识别性能将大为下降。联合因子分析(JFA)在不匹配信道环境下耳语说话人识别已经取得了很好的效果,它能够从模型方面分离出说话人和信道信息,从而进行信道补偿。本文只采取了联合因子分析方法中的一部分,只估计说话人空间,并从中提取出所包含的说话人因子,将说话人因子与支持向量机(SVM)结合起来构建一个基于因子分析-支持向量机(FA-SVM)的耳语说话人识别系统。本文在该识别系统的基础上增加了类内协方差规整(WCCN),线性判别分析(LDA)和冗余属性投影(NAP)三种信道补偿技术,并将经过信道补偿之后的说话人因子输入到支持向量机系统中进行识别。实验证明采用信道补偿之后的系统获得了比基线系统更好的识别结果。因为估计出的说话人因子仍然会包含信道信息的特点,本文对上述三种方法进行了相应的改进。针对类内协方差规整,本文采用平滑的类内规整矩阵取代原来的矩阵以改进识别效果。针对冗余属性投影,本文分析了冗余属性投影和基线系统之间的关联,提出了一种介于两者之问的差异补偿-冗余属性投影(VC-NAP)系统,该系统实现了一种可调的信道补偿,避免了因完全的NAP所带来的补偿误差,实验证明基于VC-NAP的系统比基于NAP的系统的识别效果要好。