基于信息理论学习的支持向量数据描述集成

来源 :河北大学 | 被引量 : 0次 | 上传用户:th3966733
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
单类分类是介于监督学习和无监督学习之间的机器学习任务,它能够有效地解决仅有一类样本训练分类器的问题和类别极端不平衡问题。迄今为止,涌现了大量的单类分类方法,其中最为常用的有一类支持向量机(one-class support vector machine,OCSVM)和支持向量数据描述(support vector data description,SVDD)。为了进一步提高单类分类器的分类性能,可以对多个单类分类器加以集成。然而,已有的单类分类器集成方法并未综合考虑差异性和选择性集成对集成性能的影响。基于此,本文在已有单类分类器集成的基础上,结合信息理论学习,对基于信息理论学习的SVDD集成开展了研究。1.提出了基于相关熵和距离方差的SVDD选择性集成方法。所提方法使用相关熵代替均方误差,用于度量集成的紧致性,从而构造出更为紧致的分类边界。同时使用训练样本到各最小包围球中心的距离的方差作为集成的差异性度量。此外,在目标函数中引入基于l1范数的正则化项,实现选择性集成。最后,利用半二次优化技术对所提选择性集成模型进行求解,实验结果表明,所提方法比相关方法具有更优的分类性能。2.提出了基于相关熵和Renyi熵的SVDD选择性集成方法。所提方法利用各个样本到集成中心距离的Renyi熵作为集成的差异性度量,并使用半二次优化技术对所提选择性集成模型进行求解。在人工数据集和标准数据集上的实验表明,所提方法具有更优的鲁棒性。
其他文献
移动无线网络通信技术是近年来发展非常迅速的一项计算机技术。目前的移动无线网络按照网络节点运动模式的不同可分为传统的移动无线自组网(Mobile wireless Adhoc NETwork,
数据仓库作为信息技术领域一个重要的研究方向,越来越受到人们的重视。早期的数据仓库,其构建和研究工作都是建立在关系型数据库管理系统(RDBMS)的基础之上。随着数据规模的
随着互联网技术与移动通信技术的发展,手机定位、车辆监控等提供基于位置服务的应用提出了有效管理移动对象数据的要求,推动了移动对象数据库研究的蓬勃发展。在移动数据库的研
有“墙壁上的博物馆”之称的敦煌莫高窟,以其精美的壁画和塑像文明于世,吸引了无数国内外游客前来观光。巨大的游客流量使得洞窟在面临持续的自然侵蚀外,还要承受人为的影响
学位
弹性分组环(Resilient Packet Ring)是一种应用于高速城域网的环形网络架构,并且拥有故障容忍与带宽使用率高等特性。在弹性分组环的拥塞控制中,公平性、稳定性、和收敛时间
进入二十一世纪,P2P技术发展十分迅速,各种新的P2P (Peer to Peer)应用软件层出不穷,它改变了传统的C/S (Client/Server)模式,所有节点地位都是对等的,弱化甚至取消了中心服
Grover量子搜索算法以其研究对象的普遍适用性受到了众多学者的关注,利用量子本身具有的并行性,Grover算法能够将搜索时间的复杂度降低为O ( N )。目前对于Grover算法的研究
近年来,移动设备和无线网络的广泛应用带来了基于位置的服务(LBS)应用的快速发展。位置信息相关的查询在LBS中扮演了极为重要的角色。其中一种重要的查询是(单色)反向k近邻查
学位