论文部分内容阅读
社会网络模型是对实际复杂系统的抽象表示,节点代表系统元素,边代表对应元素间的交互关系,网络中的关键元素称为有影响力的节点。关键节点的识别为现实中多种问题提供了解决方案,比如在网络营销中用最少的花费实现最好的扩散结果、或在舆情控制中快速有效定位信息传播源等。本文旨在解决影响力最大化问题,研究目标是如何从社会网络中选取若干种子节点作为传播源进行影响力传播,在扩散达到稳定状态时实现传播范围最大化。现有影响力最大化问题的解决方案包括启发式算法和贪心算法,其中启发式算法计算简单,但具有较强的针对性;贪心算法在各类拓扑网络中均具有较高的准确性,但时间复杂度高。启发式算法中,现有的基于核度的影响力最大化算法是将系统核直接作为种子集,利用连通分支和点断集衡量了节点集维持网络连通性的能力,但没有研究局部拓扑对影响力传播的作用,种子集规模固定且无法对种子节点的影响力进行区分。基于对现有方法优势与不足的分析,本文使用核度理论解决影响力最大化问题。本文基于核度理论定义了节点核度,并用节点核度差值衡量了节点距离网络核心层元素的远近。为了研究网络拓扑对元素关键程度的影响,本文在实际数据中分析了局部聚类系数、度与节点实际影响力之间的相关性,由此定义了节点的加权聚类系数作为网络拓扑特征的度量指标。本文向节点核度差值中引入加权聚类系数,定义了节点的加权核度(CBWCC)作为节点影响力的度量指标,设计并实现了基于加权核度的社会网络影响力最大化算法,其中网络正子核、核算法分别是对核度理论中系统正子核、核算法进行改进得到的,有效减少了算法运行时间。本文提出的加权核度影响力最大化算法实现了对全部节点的排序,并可以输出指定规模的种子集。为了验证加权核度算法的有效性,本文实现了基于SIR模型的传播仿真工具,在公开数据集上验证了算法性能,并与度中心性(DC)、介数中心性(BC)和接近中心性(CC)方法进行对比。实验结果表明加权核度种子集的影响传播效果最优,在多种拓扑类型网络中均能实现大范围的影响力传播,且在异构网络和种子集规模更大时,本算法具有更大优势。