论文部分内容阅读
微博平台作为一种新的舆论媒介,吸引了我国大部分网民参与,已经成为热点事件产生和传播的重要场所。而微博平台的快速发展,使得突发事件的与媒介相关的风险大大增加,所有这些都给相关的社会舆情管理部门在寻找应对相关的突发社会危机措施时带来了非常大的困难。因此对热点事件的进行观点挖掘研究可以为政府快速了解网民诉求和把握网民观点演变特点提供参考。本文在国内外学者的研究基础之上,结合微博用户的特点和微博热点事件生命周期特征,详细界定了动态观点树的概念,对构建流程进行了分析,并指出现有方法在动态观点树构建中的不足。其次,针对文本向量空间的不足,结合PMI-IR的情感计算方法和文本向量空间的原理构建了一种情感向量空间模型,对每条微博评论生成一个三维的情感向量,用于情感倾向统计和观点聚类。然后,针对传统聚类算法在处理微博热点事件这一类动态演化数据方面的不足,对演化聚类算法进行研究,首次提出演化k-medoids的概念和算法流程,通过实验证明其在在动态演化数据聚类上的时序平滑性和稳定性。最后,结合微博社会热点事件的真实数据,基于演化聚类算法构建微博热点事件动态观点树,并分析网民观点演变特点和情绪演变特征,为舆情管控提出建议。本文的贡献主要体现在:⑴详细界定了动态观点树的概念和构建流程。定义了动态观点树的概念,分层次介绍了动态观点树的结构,展示其在舆情分析和管控中的意义和作用。⑵结合PMI-IR的情感计算方法和文本向量空间的原理构建了一种情感向量空间模型,对每条微博评论生成一个三维的情感向量,用于情感倾向统计和观点聚类,解决文本空间向量在聚类效果准确率不高,且与情感分析不能有效结合的问题。⑶将演化聚类算法应用到微博热点事件这种动态演变数据中,并首次提出演化k-medoids的概念和算法流程,通过实验证明了其在动态演化数据聚类上的时序平滑性和稳定性。