论文部分内容阅读
病毒传播和信息传播是复杂网络中十分重要的研究课题。目前,很多工作解释了信息传播迅速的原因以及如何加速传播。在实际的网络中,有一类节点对于传播的过程有着十分重要的作用,这类节点被定义为影响力节点。影响力节点比其他节点能够使得病毒传播和信息传播更快更广,并且已经有很多针对这些节点的排序算法被提出来,通过这些节点来控制传播的过程,例如在复杂网络中有一类节点同时属于多个社团,免疫那些处于最多社团的节点能够有效保护网络,防止网络被攻击。总之,识别复杂网络中影响力节点有着十分重要的理论研究和实际应用价值,例如出版物、科学家、运动员的排序或寻找领导者。如何有效的识别影响力节点一直都是一个很大的挑战。本论文在LeaderRank的基础上考虑了节点本身的拓扑特性设计的加权算法,比LeaderRank更能有效的识别影响力节点,同时通过算法鲁棒性的分析证明算法同样具有更好的稳定性。具体内容为:(1)根据已有算法设计的特点,可以将算法分为以下几类:基于随机游走的排序算法;基于节点结构特性的排序算法;结合网络结构与随机游走的相结合排序算法。(2)本文详细介绍了加权LeaderRank算法模型的构建过程。该算法在是LeaderRank的基础上,考虑了节点本身的结构特性。在算法LeaderRank中,超级节点的分数是平均分给每个节点的。但是我们认为每个节点都有着不同的特性,例如其粉丝数不同。所以在该工作中,我们设计了一个加权算法-Weighted LeaderRank,在迭代计算过程中节点的粉丝越多从超级节点得到的分数就越多。(3)算法如果只能识别影响力算法还不能够算作是出色的算法,还要有很好的稳定性。例如,当数据有较多的噪音,或虚假链接时,出色的算法就能够有效的识别有影响力节点。本文中为了证明Weighted LeaderRank的优越性,我们将加权算法和LeaderRank算法做了对比,通过Tolerance,排序稳定性的计算结果可以观察到一加权算法更具优越性。