基于并行K--MEANS聚类分析的社群发现算法研究

来源 :东北大学 | 被引量 : 2次 | 上传用户:xiaoxiang0122
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
复杂网络社群发现算法的研究对于分析复杂网络的拓扑结构、理解复杂网络的功能、发现复杂网络中的隐藏规律和预测复杂网络的行为不仅有十分重要的理论意义,而且有广阔的应用前景。目前已经广泛应用于恐怖组织识别与组织结构管理等社会网络分析中。近年来,复杂网络的社群发现问题受到了广泛的关注,涌现出很多新颖的算法。但是,目前的社群发现算法存在划分效果较好的算法时间复杂度过高、划分速度快的算法划分质量不佳等问题。本文针对K-Means算法的一些缺点,结合其它算法的特点,加入增益函数的使用,在事先不确定k值的情况下,以最远距离为原则选择簇类中心,以最近距离为原则选择簇中元素,以此提高算法的划分精度,然后结合GPU并行化技术,将串行结构的K-Means算法改造成基于GPU并行的K-Means算法,提高算法的效率,最后使用NIVIDA的CUDA作为运算平台进行并行算法的实现。当应用到实际的复杂网络社群发现中时,则利用关联度原则对该算法进行相应的改进,并使用相关网络数据集对串行结构和并行结构的算法进行测试与结果的比较。实验表明,两个算法的划分结果相同,但是并行结构的算法相比较于串行算法有明显的速度提升。结合并行化技术的K-Means社群发现算法能够快速准确的定位网络中的社群结构,为研究人员分析社群结构提供有效的帮助,而且可以采用类似的并行化处理手段对其它社群发现算法进行并行优化。
其他文献
该文面向CSCW系统,研究组件的规划和设计,为基于组件技术开发CSCW系统提供基础和方法.该文分析了已有的CSCW系统体系结构模型的不足,归纳了CSCW系统的主要特征,并在此基础上
该文对群体决策支持系统(GDSS,Group Decision Support System)的历史、发展现状以及存在的问题进行了深入的分析,并在此基础上结合分布式计算技术、分布式人工智能(DAI,Dist
本文提出了一种基于(m,n)-门限方案和椭圆曲线密码体制的数据加密方案。在该方案中,用户分为单人用户和群组用户两种类型。群组用户是指由多个(不妨设为n个)参与者组成的一个集
无线传感器网络(Wireless Sensor Network, WSN)是由部署在监测区域内大量的微型传感器节点组成,通过无线通信方式形成的一个多跳的自组织的网络系统。它结合了计算、通信、
该文以新闻视频为基础研究了视频信息检索中的三个重要技术:视频的自动切分、注释及索引.在视频时充结构模型的基础上,提出一种新闻故事语义分割的新方法.首先,采用模糊c均值
人工智能的核心问题之一是如何表达已有知识以及如何应用已有知识进行分析处理或推理,以得到新的知识.该文主要研究两种基于概率的知识表达与推理方法——信度网和动态因果网
该文通过对现有的嵌入式Internet现方案的分析,提出了采用嵌入式网关实现控制网络接入Internet的方案.通过分析控制领域实现嵌入式Internet的特点和存在的问题,结合RTOS和嵌
随着分布式计算、并行计算、和网格计算的发展,云计算开始形成并不断地完善。云计算是基于虚拟化技术,将IT资源构成一个动态的虚拟资源池,以服务的形式供外界使用。虚拟化技
随着社会的发展和数据产生成本的下降,人类产生的数据量正在呈指数级增长,所以海量数据的分析逐渐被人们所关注。分布式计算被越来越广泛地应用到海量数据分析上,因为集中式
形式概念分析是对哲学的概念进行形式化描述的一种数学工具,己在软件工程、信息检索、数据挖掘等各个领域得到广泛应用,备受国内外研究者的重视。 本文主要关注基于概念格及