基于IB方法的选择聚类算法研究

来源 :郑州大学 | 被引量 : 0次 | 上传用户:liongliong537
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在实际应用中,尤其是复杂、庞大的数据集中通常呈现出多种合理且不同的数据模式,而传统的聚类分析方法往往关注于发现数据集中单个合理的聚类模式。这一挑战促进了选择聚类领域近年来的快速发展,它的目标是挖掘出数据中存在的多种不同且高质量的聚类结果。IB方法是一种优秀的数据分析方法,能有效地发现数据中所蕴含的数据模式。但是IB方法仅关注于产生一种高质量的聚类结果,并且其需要已知关于数据的联合概率分布。   本文提出了一种基于IB方法的选择聚类算法-Alt_sIB算法。该算法一方面通过最大化数据对象与聚类结果间的互信息来确保聚类结果的质量,另一方面通过最小化聚类结果和已知数据模式间的互信息来确保聚类结果间的相异性。Alt_sIB算法使用一种无参的MeanNN微分熵估计方法对数据对象和聚类结果间的互信息进行估算,并采用顺序的迭代方法对目标函数进行优化。Alt_sIB算法把IB方法扩展到了选择聚类领域,试图对数据中所蕴含的多种数据模式进行挖掘,并且通过使用MeanNN微分熵估计技术,不再需要已知关于数据的联合概率分布。实验结果表明:Alt_sIB算法能有效地挖掘出数据集内所蕴含的多种数据模式,其总体性能优于选择聚类算法NACI算法和minCEntropy算法。
其他文献
光纤传感器是伴随着通信技术的发展而产生的,它是以光作为信息载体,以光纤作为传输媒介的一类新型传感器。由于传统的传感器自身的特点和传感原理,不能完全满足在安全检测问题上
随着当今信息技术的发展,手机作为一种便携式的移动计算设备,它所拥有的功能越来越强大,款式越来越新颖,价格却越来越能够为大众所接受,因而手机如今已经非常的普及。现在市面上流
FMIPv6协议是基于移动IPv6的新型协议,转交地址NCoA提前配置好。MN到达目的网络后,便可直接使用NCoA与通信对端CN进行数据包的传送,减少了通信的中断时间。同时,该方案通过隧
近年来,随着互联网的普及与电子商务技术的发展,面向服务的计算(SOC)和面向服务的体系结构(SOA)正逐步变为未来软件发展的一种趋势,也已成为学术界和工业界共同关注的一个研究热
IPTV系统又叫交互式网络电视,是一种利用宽带有线电视网,集互联网、多媒体、通讯等多种技术于一体;向家庭用户提供包括数字电视在内的多种交互式服务的崭新技术。它可以方便的向
ERP系统是对企业的各种信息和资源进行全面集成,集中管理的软件系统。ERP借鉴了先进的现代化企业管理思想,集成了企业所有的信息和资源,为企业提供决策、控制、计划、运营等信息
随着全球云计算技术日渐成熟和云服务的日益普及,作为云计算基础设施的数据中心的能耗问题也日益突出。在我国,数据中心能耗目前占全国电力消耗的1%,虽然这一比例呈快速增长趋势,
随着技术和社会的进步,图像成为越来越重要的信息载体,如何对图像信息进行有效的处理成为目前研究越来越重要的内容,为了能让计算机快速合理的处理各种图像信息,有必要对图像进行
信息化是当今世界经济和社会发展的大趋势,其所产生的信息量也是非常巨大的,研究如何从这些海量数据中快速准确地获取有价值的数据信息已经成为当前科学研究领域的一个热点。
随着多媒体技术及网络的迅速发展,数字图像信息越来越多,如何快速有效地管理和查询有价值的信息已成为人们的迫切需求,因此基于内容的图像检索技术应运而生。基于内容的图像检索