基于密度峰值的重叠社区发现算法研究

来源 :吉林大学 | 被引量 : 0次 | 上传用户:juzhaoyang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在现实世界中,许多复杂系统是由大量组成单元或子系统构成的,因而可以将该它们抽象成复杂网络,网络中的节点是复杂系统的构成单元,而网络中的边则是单元之间的相互关系。复杂网络的应用领域非常广泛,如社会领域中的演员合作网、友谊网、科研合作网、Email网;生态领域中的食物链网、新陈代谢网、蛋白质网、基因调控网络;技术领域中的电力网、Internet网络以及电话线路网络,等等。尤其是近几十年间,互联网技术的迅猛发展使世界变得更小了,人与人之间的联系更加紧密,人类已经生活在充满形形色色的复杂网络的世界中。因此,复杂网络的相关研究也越来越成为一个研究的热点。目前,学者们在对复杂网络的研究过程中,发现现实网络不仅具有小世界和无标度等特征,而且还具有社区结构特征。社区与社区之间的连接虽然较为稀疏,但是社区内部的节点之间的连接却非常稠密。因此,社区结构的研究在当前复杂网络发展过程中占据着相当重要的地位。传统的社区发现算法主要分为图形分割和层次聚类两大类方法,其中,层次聚类又包括凝聚算法和分裂算法两类。随着对社区发现的深入研究,Newman等人提出了模块度函数,随后又出现了某些基于模块度极值优化的方法。然而,在现实生活中的网络,其节点并不是完全只属于某一个社区,而是可能属于多个社区,也就是说网络中存在着重叠部分。因此,学者们为了能更加真实地刻画网络的结构特征,又提出了许多重叠社区划分方法。一些研究者将统计推理应用到重叠社区划分算法中,取得了较好的效果,如GN算法、SPAEM算法等。本文主要针对复杂网络重叠社区发现算法进行研究,通过借鉴最近Science上提出的基于快速搜索和发现密度峰值的聚类方法思想,提出了“基于密度峰值的重叠社区发现算法”。本文首先对社区发现算法的相关文献进行了综述,介绍了复杂网络中社区发现算法的类别以及相应优缺点等,对一些经典算法的核心思想、适用范围、时间复杂度等方面进行了分析。之后,论文还详细介绍了Science上提出的基于快速搜索和发现密度峰值的聚类方法,分析了该算法的核心思想。在深入理解基于快速搜索和发现密度峰值的聚类方法的基础上,本文提出了基于密度峰值的重叠社区发现算法。算法首先通过给出新的距离矩阵算法避免了现有邻接矩阵都为整数,且有大量重复的问题。之后在搜索中心的过程中与原有算法一样,认为那些具有高局部密度并且到更高局部密度的点的最短距离相对较高的节点才是类簇中心。得到类簇中心后,不再限制每个节点属于某一单个社区,而是以一定概率属于各个社区,计算社区内节点的概率分布矩阵,得到相应的划分结果,从而使得重叠社区的划分成为可能。为验证所提出算法的有效性,将其应用于实际网络中,如空手道网络、海豚关系网等。对karate数据和dolphins数据的划分结果与原数据的社区划分结果基本相类似,对于稍大规模的网络得到的重叠社区划分结果要比其它算法好。论文主要是通过将基于快速搜索和发现密度峰值的聚类方法引入到重叠社区划分问题中,通过定义新的距离矩阵算法克服邻接矩阵为整数的缺陷,并以概率形式刻画每个节点属于不同类别的可能性,实现了重叠社区的划分。所提出的基于密度峰值的重叠社区发现算法简单易懂,既能够用于非重叠社区的划分,也可以进行重叠社区的划分,而且还可以扩展到加权网络。此外,该算法不用事先预设社区的个数,可以通过决策图来判断社区个数以及类簇中心节点。并且,基于真实网络的实验证明了本文提出算法的有效性。
其他文献
为了探究乳酸菌素与包膜丁酸钠共添加对仔猪肠道菌群、生产性能、肠道结构及腹泻情况的影响,将90头体重7.53kg±0.49kg的28日龄断奶仔猪随机分为3组,A组为对照组,饲喂基
目的探讨应用经皮微创钢板固定技术(MIPPO)技术结合锁定加压钢板(LCP)治疗胫骨远端骨折手术方法以及临床治疗效果。方法 46例胫骨远端骨折患者应用MIPPO技术结合LCP治疗,对患
对不同pH条件下太湖西部主要入湖河道沉积物中溶解性活性磷(SRP)和总溶解性磷(TDP)的采样分析结果表明,中部入湖河道SRP与TDP的释放表现出明显的不一致性,北部和南部入湖河道
公共部门人力资源管理激励机制的研究尚处于探索的初级阶段,公共部门人力资源作为公共部门组织管理的核心,是公共部门组织运作的基础。因此,公共部门在人力资源管理过程中应
当代警务改革围绕着警察权展开,警察权的维持秩序、惩治犯罪和服务社会三大内涵及其发展背后都离不开"警察权为什么存在"这一问题,而这需要从警察权的政治意蕴来思考其科学发
我国是一个农业大国,有可耕地将近0.95亿公顷,而其中的的干旱、半干旱以及湿润偏干旱的面积占了近52.5%。这就导致了我国在进行农业生产时需要大量的水来进行灌溉,同时我国又
介绍一种培训用线路微机保护装置仿真系统的设计与实现方案。采用面向对象技术 ,根据实际微机保护装置的构成原理建立对应模型 ,这样可以使仿真出口量完备 ,仿真效果更真实。
本文结合中国古代、现代和西方对修辞的阐释提出了修辞学的研究,不仅涉及到词句范围,还应拓宽到语言风格和语体中去。本文还在对修辞学研究的方法进行概述的基础上提出了(1)整体的
本文报道了利用自设计的PECVD系统成功地在光刻胶上淀积SiO_2,满足了在微细加工技术的三层胶工艺中对中间介质层的要求。淀积温度为200~280℃,反应气体是SiH_4—N_2O体系。 T
鉴定结论和勘验笔录作为独立证据在现行法律框架内存在种种困惑与悖论 ,文章认为在未来证据立法中应取消二者的证据资格 ,鉴定人、勘验人纳入证人范畴 ,鉴定、勘验为证据调查