基于社团结构核心区域集的凝聚图聚类算法

来源 :山西大学 | 被引量 : 3次 | 上传用户:cm603
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
复杂网络是对现实世界中存在的大型复杂系统的高度抽象,具有不同于传统研究领域常见的规则网络和随机网络的统计特征,其中比较有代表性的有小世界效应,无标度特性,聚集性,网络传递性和社团结构等。近年来,以交互作用图建模并通过各种图聚类技术发现复杂网络内部隐含的社团结构已成为研究热点。凝聚聚类是主要的图聚类方法之一,图的凝聚聚类是从完全离散的原始结点开始自底向上粒度不断增大的过程,一般凝聚聚类算法在初始时并不直接显式地考虑网络的聚类核心的存在性,从而可能影响聚类精度。  本文利用核心区域集的概念对凝聚图聚类算法进行了深入研究,主要研究成果如下:  (1)针对现实世界的大型网络,提出了社团结构核心区域概念,现实世界的大型网络系统具有社团结构特性,社团内部结构紧密,社团之间结构松散。根据社团结构核心区域概念,从结构出发定位网络中结构紧密区域,使得划分更明确,克服了凝聚聚类算法必须从单结点作为单独一类并逐渐合并造成的执行效率上的浪费,并且为提高聚类精度提供了优化的初始条件。  (2)从网络结构出发,提出了一种新的相似性度量方法,该度量方法能够精确地度量核心区域与未分类结点与之间的相似性,从而有效地改进了凝聚图聚类算法。  (3)在Visual Studio2008+Matlab R2009a平台上,实现了相关算法并对时间复杂度进行了分析。通过对多个标准数据集进行测试并给出了划分结果和实验分析,实验结果表明该算法能够提高聚类的准确性。  总之,本文从网络的整体结构出发,通过定义合理的社团结构核心区域和未分类结点的距离度量,提出了一种新的凝聚图聚类方法,进行了实验并给出简单例证,通过对实验结果的对比分析和聚类结果评测,表明其可有效地提高聚类的质量,具有一定的理论意义。
其他文献
以太网技术以其良好的稳定性、兼容性及高带宽、低成本等特点,成为了分布式数控系统的数据透明传输及底层通信能力提升的较为流行的实现方案。但与此同时,以太网的接入机制带来
近年来随着多媒体技术和互联网的飞速发展,图像信息越来越得到重视。如何从大量的图像中快速、有效、准确地搜索到人们感兴趣的图像成为当前面临的重要问题,基于内容的图像检
随着煤矿资源的日益短缺和对煤矿工作人员人身安全的越来越重视,煤矿安全的重要性越来越突出,矿山应急救援更加重要。在煤矿发生紧急事故时,如何选择最佳的避灾路线,使损失降
故障管理作为网络管理的核心功能之一,可以保证网络的可用性和可靠性,并且在一定程度上预防故障的发生。随着网络应用和网络规模的增加,及时准确发现网络中的故障变得越来越
近年来,随着战场环境仿真技术的提高,逼真的虚拟战场环境实时仿真成为作战仿真的基础。三维地形场景是虚拟战场的重要组成部分,而海量的地形数据在精度和广度上不断深化,如何