基于分类特征映射和SVM的说话人确认方法研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户：WHDMJ

【摘要】

：

随着通信与计算机技术的发展,使用电话、手机等工具进行交流的用户不断增多,电话语音也在人们的生活中占有越来越重要的地位。使用电话语音来进行说话人身份鉴别具有方便快捷

【作者】

：

贺庆玮

【机构】

：

中国科学技术大学

【出处】

：

中国科学技术大学

【发表日期】

：

2009年期

【关键词】

：

说话人确认分类特征映射支持向量机高斯混合模型

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着通信与计算机技术的发展,使用电话、手机等工具进行交流的用户不断增多,电话语音也在人们的生活中占有越来越重要的地位。使用电话语音来进行说话人身份鉴别具有方便快捷等诸多优点,其技术在金融、商贸、公安、军事等领域具有广阔的应用前景。其中,文本无关的说话人确认不需要说话人的语义配合,其应用范围更加广阔,实用性更强。近年来,支持向量机(SVM)由于其具有强区分能力,尤其适合解决类似于说话人确认这样的二元分类问题,因而成为模式识别领域的一个研究热点。然而,将目前常用的短时倒谱参数MFCC用于文本无关的说话人确认需要较多的语音数据,将SVM作为说话人模型时将会遇到大训练样本、两类数据混叠严重等问题,使SVM的建模面临着训练效率低下。本文主要针对SVM用于文本无关说话人确认中存在的问题,对使用特征空间分类和GMM进行说话人特征映射的方法进行了研究,并且对SVM的建模方法进行了探讨。主要研究内容如下:1)针对采用SVM建立说话人模型面临着大数据量样本的问题,研究了基于GMM-UBM特征映射的SVM说话人确认方法。采用GMM-UBM结构进行特征映射能够实现数据压缩,并提取代表说话人个性信息的特征矢量。本文对UBM混合度对系统性能影响,以及在NIST长语音任务中SVM建模策略问题进行了分析。2)提出了一种基于分类GMM-UBM特征映射和SVM的说话人确认方法。CGMM-UBM特征映射,使得原本混叠较为严重的数据变得更容易区分,提升了SVM分类界面的区分性能。同时,分类子空间中的GMM能够更加精细地描述说话人参数统计特性。本文针对基于VQ的特征空间划分方法和基于基因周期的特征空间划分方法,在不同子空间个数、不同GMM混合度的情况下进行了分析。实验表明:通过分类特征映射和子系统评分融合,CGMM-UBM-SVM系统相对于GMM-UBM系统,EER降低了17.2%;CGMM-UBM-SVM系统相对于GMM-UBM-SVM系统,EER降低了7.6%,系统性能有了进一步提升。

其他文献

基于听觉掩蔽效应的小波包语音增强方法研究

随着时代的进步,各种计算机语音应用系统与通信技术飞速发展。许多性能优良的语音系统使用了语音增强技术。语音增强的目的是消除背景噪声的影响,改善语音质量,提高人们间的

学位

语音增强听觉感知听觉小波包分解最小值统计听觉掩蔽阈值函数

混沌现象在DC-DC变换器中的行为研究

混沌现象在非线性动力学系统中以有界、非周期、类随机的形式出现。而DC/DC开关电源是非线性动力学系统的子集之一。当由于某种或某些因素(比如电压、电流、环境温度、湿度等

学位

混沌控制开关电源离散数学模型变换器非线性动力学Lyapunov指数

液滴锡靶激光等离子体碎屑和极紫外辐射特性研究

近年来，随着电子产品爆发式的增长，半导体产业不断追求缩小芯片刻蚀的特征尺寸以提升产品的性能，芯片生产所采用的光刻技术正面临着巨大的挑战。极紫外光刻技术采用中心波长13.5

学位

激光等离子体液滴锡靶极紫外光源离子碎屑辐射特性芯片刻蚀极紫外光刻

基于分类特征映射和SVM的说话人确认方法研究

其他学术论文