基于聚类的社区探测方法研究

来源 :河南理工大学 | 被引量 : 1次 | 上传用户:felixzhu2005
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现实世界的许多复杂系统都可以抽象为复杂网络,在这些复杂网络中,节点可以用来表示真实系统的样本对象,而节点间的连接(边)则可以表示样本对象之间的相关关系,节点的特征属性代表不同样本的兴趣倾向。社区探测技术旨在发现复杂网络中的结构划分,通过将相关度较高的节点进行合理分类,进而得出这种分类在不同领域的意义所在。聚类是实现社区探测的主要方法之一,本文主要基于聚类算法针对非重叠社区和含有特征属性的重叠社区两方面存在的问题进行分析研究,研究内容主要包括:1.现有基于聚类的社区探测方法,通常难以通过网络原始节点信息来确定社区数目,另外相似度的随意选择也会导致社区划分结果的不确定性,采用贪婪策略的社区探测方法可能导致最终结果陷入局部最优解。针对这些问题,本文在信息理论框架下提出了一种基于划分式聚类的社区探测算法pIBD(partitional Information Bottleneck clustering based community Detection)。该方法利用网络原始节点信息,通过描绘互信息损失曲线,对最佳社区数目进行合理预测;基于信息瓶颈理论计算对象间的相似度,并以此设计出划分式聚类的目标函数。实验结果表明,pIBD算法能够利用网络原始节点信息对社区数目进行预测,同时显著提升了社区划分质量。2.传统的重叠社区探测主要利用模糊聚类和联合聚类方法对二维数据网络进行社区划分,对于具有特征属性的三维数据网络则没有相应的解决方案。因此,本文结合了模糊聚类、联合聚类和三维聚类等方法,提出一种基于三维模糊联合聚类的社区探测算法FTC(Fuzzy Tri-Clustering)。该算法通过分析网络节点与特征属性的概率相关模型,同时在三个数据维度上进行聚类处理,并通过与现有二维模糊联合聚类的对比实验证明了FTC算法具有较好的聚类质量,从而实现对具有特征属性重叠社区的有效划分。该算法同时适用于三维以上的数据结构,为多维数据的聚类方法提供解决思路。
其他文献
铝合金材料凭借其优异的性能在航空航天、交通运输等领域应用广泛。然而工业生产中对铝合金材料的加工精度要求很高,铝合金材料不能通过磨削进行高精度加工,部分研究人员提出在传统车削加工中引入修光刃刀具实现对铝合金材料的高质高效加工,但是修光刃刀具在加工过程中会使工件表面产生二次刀痕,且刀具磨损较快。本文进一步提出了在修光刃刀具车削过程中引入进给方向的超声振动方法。通过结合上述两种方法,将会大大提高工件的加
Gr(?)bner-Shirshov基理论是上个世纪60到70年代分别由Buchberger(对交换代数),Bergman(对结合代数)及Shirshov(对李代数)等数学家为了解决代数学中的约化问题而共同建立起来
在进行小学教学的过程中,综合实践科目是非常重要的,这门课可以培养学生的综合素养,目前,随着经济和文化的发展,全球一体化的经济情势也变得更加显著,综合实践课程更加符合目
随着我国经济高速发展,商业用户和居民用户的用电量都逐渐增加,使得负荷峰谷差不断变大;同时,由于国家大力提倡发展可再生能源,风电和光伏等分布式电源大量地接入配电网,导致配电网“标准低、联系弱、低电压”等问题日益严重。分布式储能技术作为一种有效的调节手段可以很好地解决配电网面临的负荷峰谷差和电压质量问题,并延缓配电网的设备扩容。本文针对分布式储能在配电网中的应用,从3个方面对其展开了研究:1)聚合控制
椰棕是一种产量丰富的可再生生物质资源,除了少部分的椰棕被用来生产低附加值的产品,大量部分的椰棕被废弃,造成了环境污染和资源浪费。本文将通过化学处理的方式,为椰棕的利用寻找新的途径。本文以微波辅助加热方式对椰棕(CF)进行液化,同时讨论液化温度、时间、催化剂用量及椰棕的用量等实验条件对液化率的影响。并结合渗透凝胶色谱、红外光谱对最优液化条件下的液化物进行表征。将椰棕液化产物(CL)与聚乙烯醇(PVA
曲线匹配技术在模式识别中是一项关键的、广泛使用的技术,同时在实际应用中,如三维重建、视觉导航、文物复原、视频监控系统、机器人技术以及图像拼接等诸多领域中也有广泛的
贫困是阻碍社会经济发展,影响人民幸福生活的重要因素。2013年11月3日,习近平在湖南调研时首次提出精准扶贫重要思想。在精准扶贫思想的指引下,运用科学有效程序对扶贫对象实施精确识别、精确帮扶、精确管理,进一步加快贫困地区经济社会发展。具体至少数民族聚集、位置偏远、民众思想观念及经济条件较为落后的乡镇,只有以市场为导向,以经济效益为中心,培育主导产业,才是激发内生机制,消除贫困发生动因的根本所在。本
实用类文本阅读作为高考的重要题型之一,是考核学生阅读能力的重要载体,并已逐渐引起教育工作者和一线教师的重视。但目前实用类文本阅读无论是从深度、广度来看,研究都还不够。本文以恢复高考以来贵州历年高考阅读试题为例,对实用类文本阅读的命题依据、命题原则、文本材料、试卷题型、考查标准等进行详细的归纳整理并在这些数据的基础上进行分析,针对实用类文本阅读试题解答和教师教学等问题进行研究,对应提出建议,冀此为一
学生欺凌一直是社会上的棘手问题,损害学生的身心健康,造成不良的社会影响。农村学校管理相对薄弱,容易成为学生欺凌的多发场域,本研究以K学校为个案,梳理学生欺凌预警机制的实施现状,剖析学生欺凌预警机制存在的主要问题,并提出改进学生欺凌预警机制的建议。本论文主要由绪论、正文和结语组成。绪论介绍了本研究的前期准备,包括研究背景、研究意义、相关研究综述、核心概念界定、理论基础等五部分。第一章是研究设计,主要
一维土层场地地震反应分析一直是工程场地地震安全性评价工作中的重要环节,本质上是从近场波动角度进行水平成层模型动力反应的数值模拟。然而,传统的近场波动数值模拟方法多