论文部分内容阅读
为探索公共突发事件期间民众在网络空间争相转发分享信息时表现出的群体性特征,以2012年发生的雅安地震、2013年发生的彝良地震、2009年爆发的甲型H1N1流感疫情、2013年爆发的甲型H7N9流感疫情和普通流感五个话题为社会背景,以参与谈论这些话题的微博用户为实证对象,从用户群体特征、信息流结构和信息扩散网络拓扑特征三个角度对6项用户个体属性、5类转发行为和11项社会网络拓扑参数进行了测量研究。 现有的微博数据采集方案在目标群体的选择和微博信息筛选范围的限定上都是随机确定的,而且采集系统的可用性对数据服务协议中的具体规则依赖很强。为完成指定时间段内特定事件的微博舆情数据采集任务,研制了内嵌网页爬取模块和新浪微博公共APIs的微博数据采集系统,并完成了上述五个公共事件对应的两份地震主题数据和三份疫情主题数据的采集工作。 基于网络数据集的实证研究其普适性并非完美无缺,因为个体行为和当时的社会上下文紧密相关,所以尽可能准确地描述数据内容就非常必要。为此,在对五份数据集的存储结构、数据规模和时空分布进行说明后,借鉴语义网络中描述本体的符号化思想,构建了一个包括用户、博文、转发行为、博文转发树四类实体对象的微博信息流形式化模型。借助该模型给出的符号体系,对测量内容及其求解过程进行了较为严格的形式化描述。 测量结果显示:(1)在日常情况下,微博信息的影响范围具有很强的地域性,但在发生地震或爆发疫情后,身处经济政治中心地区的用户会迅速活跃起来;粉丝数、好友数、博文转发数的频率分布均呈现幂率特性,而且“邓巴数字”断言在粉丝数和好友数频率分布中出现的分段特征得到了印证。(2)微博应用确实拉近了草根民众和公众人物间的距离,而且粉丝规模对吸引公众关注帮助很大,但人们极少转发粉丝发表的信息;从消息传播的角度看,除了粉丝群体以外,不存在任何社会关系的陌生用户间的信息转发行为同样很重要,尤其是发生地震后,陌生用户间的转发量可以占到总转发量的一半以上。据此推断,微博应用确实有交友功能,但信息分享功能对用户的吸引力更大。(3)活跃群体组成的信息扩散网络具备无标度和小世界特性,但用户间的组织性较为松散;权威用户群体重合度测量结果显示,相比传播的大众媒体,微博平台更像是坐拥海量粉丝的媒体人迅速抓住社交时代特性并用来引导舆论的新渠道。