论文部分内容阅读
近年来,在互联网上蓬勃发展的微博越来越多地引起了人们的关注。微博从传统的社交网络中脱颖而出,在拥有了独立的服务平台后逐渐演化为一种新的信息发布形式。但是在快速发展的同时也面临了一些问题,比较突出的是欺诈信息、虚假信息、谣言诽谤甚至反动信息等都会通过微博快速传播,以致引发恶性群体性事件。论文结合国家863项目“面向三网融合的统一安全管控网络”,以复杂网络的研究成果为基础,研究微博的社区发现技术,提出一种新的微博用户影响力评价模型,利用该模型可对微博用户在网络中的重要程度进行排名。将微博用户影响力的评价结果与复杂网络的社区发现算法相结合,从而可实现对微博社区的划分。利用本文的研究成果,能够与相关的网络舆情分析模型及系统结合,为微博网络舆情监控提供相关思路和技术支持。论文主要工作如下:在利用微博网站所提供的API接口获取实时数据的基础上,对微博用户的行为特征进行统计分析,提出一种基于用户行为的影响力评价模型,实现了对微博用户在网络中重要性的评估。仿真结果表明模型能够准确的评价微博用户的影响力。针对微博网络中存在大量的星形结构,结合用户影响力的研究成果,提出了一种基于星形结构的微博社区发现算法。从理论上对算法的合理性和算法复杂度进行了分析,仿真实验表明该算法较之经典的社区发现算法能够获得更为准确的社区划分结果,同时算法的执行效率有所提升。结合Newman提出的模块函数的思想,提出了一种基于种子扩展的微博社区发现算法。算法充分考虑了用户节点的特征属性,弥补了已有算法仅仅使用节点之间的连接关系来划分社区的片面性。仿真实验表明该算法的社区划分结果较为贴近实际情况。但是由于添加了节点属性,在算法复杂度上有所增加。综合考虑多种因素,为了满足实际情况下对实时性和有效性的要求,在对微博网络进行分析时,可将该算法与基于星形结构的社区发现算法结合使用,在后者快速识别的基础上对整个网络进行更为精确的划分。