论文部分内容阅读
社区结构是复杂网络普遍存在的拓扑特性之一。挖掘网络中存在的社区结构成为近年来复杂网络领域中的热门问题,并取得了一定的研究成果。然而,随着网络的规模和结构日益复杂而庞大,现有的一些社区发现算法已不再适用。同时,复杂网络中可能存在着重叠结构,一些算法没有考虑到这一特点,以致无法发现网络中的重叠部分。为了解决上述问题,本文结合基于信号传播的相似度计算方法和模糊AP(Affinity Propagation)聚类,提出了一种新的可并行化的重叠社区发现算法CDSFAP(Community Detection by Signal-based Fuzzy Affinity Propagation)。首先,对基于信号传播的相似度计算方法进行了改进,提高了算法的计算准确性和处理复杂图结构的能力。接着,向模糊AP聚类中引入模糊熵(fuzzy entropy)理论,使得算法能够根据节点的模糊性,识别出网络图中的重叠节点。最后,借助MapReduce编程模式,将算法迁移到了云平台。通过对比CDSFAP算法与其它算法在多组测试集上的社区划分质量和运行效率,验证了算法的可行性。同时,在处理大规模网络测试集时,算法的MapReduce版本也表现出了较为理想的效果。