异质信息网络中的社团发现研究与实现

来源 :北京邮电大学 | 被引量 : 3次 | 上传用户:hzjiawei333
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网的高速发展使得社会网络分析得到了广泛的研究。之前的社会网络分析大多数是针对由同种类型节点组成的同质信息网络的。然而,真实世界往往更为复杂,网络中包含的对象类型更多,对象之间的关联关系也更加丰富。所以,通过异质信息网络对这类网络建模更为准确。异质信息网络是指由许多不同类型的对象互相关联形成的信息网络。目前,很多数据挖掘任务(如:相似性计算、社团发现等)都在异质信息网络中开展。相似性计算用来评价对象之间的相似性,社团发现可以探测出网络的社团结构,它们是许多数据挖掘任务的基础。元路径是由定义在不同种类对象之间的一组关系构成的路径。不同的元路径表达了不同的语义信息,因此大多数异质信息网络中的数据挖掘任务都是基于元路径的。目前,异质信息网络中基于元路径的相似性计算方法大多都没有将链接上的权值信息考虑在内。然而,链接上含有权值信息的网络是普遍存在的,例如:推荐系统、文献网络等。如果忽略链接上的权值信息,可能造成相似性计算结果与真实结果之间的差异较大。另外,目前大多数社团发现任务都是在同质信息网络中开展的,在包含更丰富的网络结构和语义信息的异质信息网络中开展社团发现更为困难。针对以上问题,本论文首先提出了一个异质信息网络中考虑权值信息的相似性计算算法。该算法通过考虑权值信息的异质信息网络和权值元路径的概念将链接上的权值信息包含进来。之后将权值元路径进行拆解和合并,使得传统异质信息网络中的相似性计算方法可以应用其中。通过在推荐系统、相关性搜索和聚类分析中的应用,证明了考虑权值信息的相似性计算方法的优越性。其次,本文提出了一个异质信息网络中的社团发现算法HCD(Heterogeneous Community Detection)。该算法由两部分组成:基于单条元路径的社团发现算法HCD_sgl和融合多条元路径的社团发现算法HCD_all。HCD_sgl对传统标签传递算法进行改进,首先通过筛选种子节点,并在种子节点网络中进行社团发现,减少了网络中初始标签的个数,提高了算法的准确性。之后通过引入社团归属度的概念使该算法可以应用于重叠社团发现。HCD_all在HCD_sgl的基础上将基于多条元路径的社团发现结果进行整合,得到异质信息网络中融合多条元路径的社团发现结果。通过在真实数据集和人工数据集上的实验证明了 HCD算法可以有效地探测出异质信息网络中的社团结构。
其他文献
神经炎症贯穿神经退行性疾病的整个发病过程,在正常的生理状态下,神经炎症有助于神经系统损伤的修复,而当炎症反应过度时则会造成细胞的损伤,加速神经退行性疾病的恶化。对神
<正>1985年,我国设立"教师节"。这比1994年国际社会设立国际教师节提前了9年。2014年9月9日,教育部在京召开庆祝第30个教师节暨全国教育系统先进集体和先进个人表彰大会。来
美国的对外政策是美国社会思潮的集中体现。被称为第五种权力的美国思想库在美国社会中占有重要地位 ,它们对美国社会思潮产生重大影响。本文尝试建立美国思想库流派对社会思
在1982年的英阿马岛战争期间,美英双方的密切合作往往被人们视为里根—撒切尔时期美英特殊关系再次复兴的重要表现。的确,美国对英国的支持,是英国能够在三个月内迅速取得胜
作为近代的产物 ,民族主义在不同的时期、不同历史事件中有不同的表现和功能。那么 ,在全球化时代 ,民族主义又会扮演何种角色呢 ?本文旨在从理论、历史与现实的角度对之加以
作为光电功能材料,有机π共轭材料的发光效率和载流子迁移率是决定有机光电器件性能的重要参数,它不仅决定于材料的分子结构,而且取决于分子聚集体中分子的堆积模式(即聚集态结
随着我国城市地铁的讯速发展,盾构法隧道开挖得到了广泛的应用。土压平衡盾构在圆砾、卵石地层中施工出现了许多问题,如动态土压平衡难以形成、刀盘扭矩过大、刀盘和刀具磨损
以水-水热交换器为例,以CFD模拟软件为手段,以κ-ε模型为基础构建人字形波纹板式换热器模型,并系统分析波纹倾角、波纹深度、波纹间距这3个重要几何参数对换热器内部温度场
1 前言灵敏素质是指人体在运动活动中所表现的一种复杂的素质。它是人体运动技能的各种素质的综合体现。它在人体从事体育运动当中起重要作用,尤其是在一些非周期性运动项目
本文着重介绍电泵井动态控制图各个区域的划分方法,首先从流压与排量效率关系入手,对流压计算方法进行修正,并借鉴过去对动态控制图的研究情况,对各区域进行合理划分,研究出