基于多视角社区发现的实体聚类算法

来源 :北京化工大学 | 被引量 : 0次 | 上传用户:lcc00060
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,多种形式的网络社交平台愈演愈烈,用户可以利用这些社交网站和内容共享平台来建立自己的社交关系,如与他人实时交流,发表文章,与他人共享资源等。因此,需要在社会关系网图中识别出在某一属性达到局部最优的稠密子图,即社区发现(Community Detection,也称为社区挖掘),社区发现是数据挖掘,机器学习和图论等理论研究的热点。现如今,社区发现技术更是广泛的使用在犯罪团伙检测,蛋白质功能检测,Web社区检测和文档归类等不同领域。在庞大的社交关系网络中,一方面传统的单视角社区挖掘算法划分条件比较单一,所考虑的影响因素不全面,从而导致了其划分结果的不精确。另一方面,现有的多视角社区发现算法虽然可以用来挖掘全局网络的复杂关系,但限制条件比较多,适用性很低。针对上述问题,本文介绍了一种基于多视角社区发现的实体聚类算法,并从多个角度进行改进,本文的主要贡献点如下:(1)提出一个2阶段多视角网络社区发现模型2-MND(Two-stage Multiple Views Network Detecting Model),不同于传统的发现模型,该发现方法利用各个视角中的相互促进关系来提升局部社区发现的准确性,并通过聚类融合的方法来优化全局社区发现划分性能。(2)提出多视角局部协同选择聚类算法(Collaborative Multi-view Local Selecting Clustering,即co-MLSC),使用局部协同训练方法解决大多数多视角聚类算法中充分条件的限制,而导致聚类不准确的问题。(3)得到改进的多视角全局社区融合算法(Multi-viewGlobal Community Fusion,MGCF),该算法是将标签匹配和投票相结合的聚类融合算法,解决了传统多视角聚类融合中节点集不同和聚簇个数不同的限制问题。
其他文献
现在互联网的主要功能已从传递端到端的消息转变为分发大规模的内容,如何高效节约地完成面向汽车用户的互联网内容分发是学术界和产业界一直共同关注的热点,也是本文的研究重
人脸识别一直是机器学习领域的热门问题,针对不同场景和不同目标,人们提出了各种解决算法。随着压缩感知理论的发展和成熟,其在人脸识别领域的一项应用就是稀疏表示识别算法,
随着移动互联网的快速发展,人们对高速数据业务的需求日益增长。在传统的异构网络中将更多的小型化基站(Small Cell)部署于宏基站(Macro Cell)的覆盖范围之下构成密集部署Sma
钙钛矿太阳能电池(PSCs)的效率屡创新高,目前单节钙钛矿太阳能电池的最高效率已接近商用单晶硅薄膜太阳能电池的效率值。钙钛矿太阳能电池的光电转换效率很好,但迄今为止稳定性还不太理想,除了外界诸多如湿热等因素影响外,钙钛矿材料中的I-离子可能对稳定性有些负面影响。基于上述问题的考虑,本文从钙钛矿材料本身出发,设计器件结构,利用溶剂工程、带隙工程、溶液中分子内交换反应等方法制备平整均一且质量高的钙钛矿
为了应对移动互联网迅猛发展带来的井喷式增长的移动宽带业务需求,针对第五代移动通信(5G)系统的讨论已经广泛开展。作为5G的一项关键候选技术之一,全维度多入多出技术(Full
当今社会,随着人们越来越关注生活质量和自身健康,生物医学健康无疑成为21世纪全世界科学家和学者们普遍关注和研究的热点话题之一。作为关系着人类生存的最本质的问题,它具
基站端配置数十甚至上百根天线的大规模MIMO无线通信系统成为5G无线通信网络有前景的技术。为了评估和优化大规模MIMO无线通信系统的性能,有必要研究能充分反映大规模MIMO信
电子证据的可信性在司法界和学术界引起了广泛关注。人们难以精确地对电子证据的可信性进行判别和度量,致使取证得到的数据经常遭受到质疑。在取证分析及证据呈示阶段,缺乏有
以GaAs为代表的化合物半导体材料具有更大的禁带宽度和更快的电子迁移率,因此利用GaAs为基础制造的半导体激光器、量子点红外探测器、高效红外发光二极管和太阳能电池等,展现
相比于单播通信,多播通信能够更好的提升频带利用率和传输速率。多播通信中,资源分配算法的地位举足轻重,因为多播通信的吞吐量和场景中的资源分配方案息息相关。本文分别研