论文部分内容阅读
随着社交网络的发展,人们可以非常平等快捷的发布和接受信息,这导致线上生活对线下生活的影响越来越大。社会化营销应运而生,其非常重要的一个需求是要最大化营销活动在社交网络中的影响力。因此,社交网络中用户影响力分析成为一个至关重要的研究点。它旨在分析用户在社交网络中对其他人的影响力大小,并且在预算有限的前提下,选择出最有利于影响力传播的一批用户,以使得最终对网络的影响最大。很多社会学工作者早先已经对影响力做过社会学角度的研究,随着Facebook、Twitter等社交网络的兴起,越来越多的学者开始在如此复杂如此巨大的网络中研究用户的影响力,甚至出现很多以分析用户影响力而生的企业。但是目前对用户影响力的分析主要着眼于定性分析,很少有研究者进行定量的分析。本文在调研前人工作的基础上,将社会学和信息传播领域的相关模型引入到新浪微博中,并详细的对比分析了不同模型方法的不同。首先,本文考察了基于网络结构的影响力分析方法,主要包括社会学领域的最大度算法、距离中心点算法、类似PageRank算法的PeopleRank算法并对比了用户的实际平均转发率。其次,我们引入了两个概率模型-独立级联模型和线性阈值模型。基于这两个模型的算法不仅将网络结构纳入考虑,而且着重考虑了用户历史上与其他用户的交流行为。实际效果表明,这两种算法要比只考虑网络结构信息的分析方法表现更为突出。而对于选择最优K子集最大化影响力的问题,基于两个模型的贪心选择算法,都是对于最优解不小于63%的近似。本文还对两种K子集选择算法进行了效率上的优化,实际结果表明,结合网络结构对贪心算法进行优化,可以在提高效率的同时并不丧失太多的计算精度。最后,我们对各个模型和方法进行了分析,提出“结构影响力”和“行为影响力”的概念,从两个方面考察用户的影响力。我们建立了一个影响力综合分析系统,可以对社会化营销领域提供支持。