支持向量机算法的研究及在说话人识别上的应用

来源 :浙江大学 | 被引量 : 0次 | 上传用户:lcmeng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
统计学习理论是一种专门研究有限样本情况下机器学习规律的理论,它不仅考虑了对推广能力的要求,而且追求在现有有限信息的条件下得到最优结果。支持向量机是在统计学习理论的基础上发展而来的一种新的模式识别方法,在解决有限样本、非线性及高维模式识别问题中表现出许多特有的优势。 本文的工作是以说话人识别为背景研究支持向量机的理论和方法。说话人识别属于生物识别技术的一种,是一项根据语音波形中反映的说话人生理和行为特征的语音参数,自动鉴别说话人身份的技术。为了达到这个目的,我们在详细研究支持向量机的最新进展和说话人识别的主要特点的基础上,围绕三个问题对支持向量机的理论和方法进行了较为深入的研究。 本文的第一个工作是研究了支持向量机的多类分类算法。痉典的支持向量机分类算法是针对二类分类的,对于多类分类,研究者们先后提出了一对多组合和一对一组合的方法。本文从两个角度对各个分类器的综合进行优化:其一是建立全局目标函数,将所有的分类目标函数综合起来;其二是利用决策树的方法,将分类器分布在各个节点上。 本文的第二个工作是针对开集说话人辨认问题,提出了支持向量区域描述算法。支持向量区域描述算法的主要思想是建立一个超球,包含所有同类点,目标函数使球半径尽量小,并且球内包含尽量多的同类点。我们进一步将该算法推广到多类分类问题上,建立了在开集背景下,进行说话人辨认的理论基础。 本文的第三个工作是结合支持向量机和隐马尔可夫模型、高斯混合模型各自的优点,建立混合模型。在说话人识别问题上,虽然原有的马尔可夫模型和高斯混合模型具有良好的时间规整能力,但是,受极大似然准则的限制,他们的类别区分能力较弱。支持向量机以结构风险最小化为准则,具有很强的类别区分能力。本文将支持向量机与这两种模型相结合,并取得了较好的实验结果。
其他文献
随着计算机网络技术的发展,人们对网络传输数据的安全性要求越来越高。传统的加密体制使用同一个密钥进行加、解密,要求在传输密文的同时也要将密钥传输给接收者,这就增加了
图像的显著性是以区域的形式表现出来的,是指图像中最引人注意且最能表现图像内容的部分。显著性检测就是通过模拟人类视觉系统将图像中的显著部分提取出来的过程。图像显著
网络多媒体监控系统是一个集多媒体信息的综合性、计算机的交互性、通信的分布性和监控的实时性等技术于一体的综合系统。针对当前的网络多媒体监控系统具有部署困难、跨平台
随着虚拟现实硬件设备以及虚拟现实技术的发展,虚拟现实不仅在科研和设计等领域应用广泛,在科技展示领域也得到了越来越多的应用。应用了虚拟现实技术的科技展品比传统的科技
互联网是个巨大的信息资源库,从这个资源库中提取和检索出有用信息是个很重要的课题。搜索引擎是通用的信息检索服务。 搜索引擎一般由Crawler、索引库、检索器和用广接口
当今世界是一个信息时代,不管是在移动社交还是在移动电子商务、物联网平台,PUSH(推送)技术都得到了很大的应用,另外,Push技术改变了传统的“拉”信息的方式,使信息主动寻找用户,更适
本文使用语言学中的标志词假设来指导汉英翻译单元的抽耿,取得了较好的抽取效果。本文从以下三个角度对标志词在汉英EBMT中的应用进行了研究:1.在介绍了目前已经使用的英语
数字签名是信息安全领域的一个重要的研究方向。数字签名能保证报文的真实性、完整性以及签名者的不可否认性。普通的数字签名具有局限性,一旦密钥被盗,攻击者就可以伪造签名
针对近年来地理信息系统(GIS,Geographic Information System)在公共管理,科学研究和商业等领域的应用现状和配电管理的实际需求,本文以配电网GIS系统的开发为背景,根据配网管理自身的特点,讨论了适合于配电网络的空间数据组织方式,重点研究了适合配电网GIS系统的空间索引结构。 随着GIS在各个领域的广泛应用,GIS已形成了多层次和不同尺度的应用格局。既要有综合型的通
本文在项目反应理论(IRT)框架下,就目前流行的参数估计方法进行分析比较;对IRT中3PLM的参数估计问题,用传统的统计估计方法解决得并不令人满意,我们应用新的估计方法——改进