论文部分内容阅读
近年来随着微博网络的飞速发展,微博用户群体不断扩大,微博网络的舆情监控以及微博网络的广告投放已经被越来越多的人所关注。目前微博网络已经成为社会网络研究的热点。本文在国内外已有的研究工作的基础上,针对微博网络的消息影响力评估不够准确以及传统消息影响力最大化算法没有考虑到微博网络特点等问题,力图更加准确地衡量微博消息的真实影响力以及能够快速、有效地找到影响力最大化的初始用户集合。目前国内外针对微博网络的消息影响力评估的研究比较少。在舆情领域,对微博消息影响力评估可以发现热点消息并监控。在商业领域,准确地定义消息影响力可以使商家了解到广告投放的效果。现有的微博消息影响力评估方法,仅从消息的转发数和评论数来对消息的影响力进行评估,然而随着微博网络的发展,仅考虑转发数和评论数的方法已经不能够准确的度量消息影响力。本文提出一种基于用户质量的消息影响力评估算法。主要考虑参与消息传播的用户的质量,并在评估过程中加入去重机制、惩罚机制,综合地对消息进行评估。最后通过实验证明该方法能够有效的屏蔽虚假的广告消息和机器人用户为消息带来的不真实的消息影响力,更加准确的评估消息影响力。社会网络中的消息影响力最大化问题一直是研究的热点,针对微博网络的消息影响力最大化研究可以防止虚假消息大规模扩散,还可用于广告投放。传统的消息影响力最大化问题主要是针对其他平台所提供的数据集进行研究的。本文主要考虑微博动态性高,数据量大等特点,提出一种基于用户行为的影响力最大化算法。算法主要考虑用户的活跃度和用户的行为偏好两方面属性,并根据用户的活跃度和用户的行为偏好对独立级联模型的传播概率进行了改进。最后通过针对KDD CUP2012发布的腾讯微博网络数据集以及人工网络数据集的实验对比,证明本文所提出的算法在消息影响力最大化效果上比几种启发式的算法上有很好的提高并且在时间复杂度上优于贪婪算法,最后算法还能够有效地屏蔽机器人用户和僵尸用户对用户影响力评估的影响。综上所述,本文重点地考虑微博用户的用户属性、用户行为以及微博网络中存在大量的僵尸用户和机器人用户的情况,对微博网络的消息影响评估以及消息影响力最大化问题进行研究。并通过实验验证方案的可行性和实际效果。