基于演化聚类的微博热点事件动态观点树构建方法研究

被引量 : 0次 | 上传用户:wang3993
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
微博平台作为一种新的舆论媒介,吸引了我国大部分网民参与,已经成为热点事件产生和传播的重要场所。而微博平台的快速发展,使得突发事件的与媒介相关的风险大大增加,所有这些都给相关的社会舆情管理部门在寻找应对相关的突发社会危机措施时带来了非常大的困难。因此对热点事件的进行观点挖掘研究可以为政府快速了解网民诉求和把握网民观点演变特点提供参考。本文在国内外学者的研究基础之上,结合微博用户的特点和微博热点事件生命周期特征,详细界定了动态观点树的概念,对构建流程进行了分析,并指出现有方法在动态观点树构建中的不足。其次,针对文本向量空间的不足,结合PMI-IR的情感计算方法和文本向量空间的原理构建了一种情感向量空间模型,对每条微博评论生成一个三维的情感向量,用于情感倾向统计和观点聚类。然后,针对传统聚类算法在处理微博热点事件这一类动态演化数据方面的不足,对演化聚类算法进行研究,首次提出演化k-medoids的概念和算法流程,通过实验证明其在在动态演化数据聚类上的时序平滑性和稳定性。最后,结合微博社会热点事件的真实数据,基于演化聚类算法构建微博热点事件动态观点树,并分析网民观点演变特点和情绪演变特征,为舆情管控提出建议。本文的贡献主要体现在:⑴详细界定了动态观点树的概念和构建流程。定义了动态观点树的概念,分层次介绍了动态观点树的结构,展示其在舆情分析和管控中的意义和作用。⑵结合PMI-IR的情感计算方法和文本向量空间的原理构建了一种情感向量空间模型,对每条微博评论生成一个三维的情感向量,用于情感倾向统计和观点聚类,解决文本空间向量在聚类效果准确率不高,且与情感分析不能有效结合的问题。⑶将演化聚类算法应用到微博热点事件这种动态演变数据中,并首次提出演化k-medoids的概念和算法流程,通过实验证明了其在动态演化数据聚类上的时序平滑性和稳定性。
其他文献
生物技术特别是微生物采油技术,已经引起了石油工程技术人员的空前关注,目前在国内外开展的微生物采油先导性矿场试验已初见成效,较为典型的当数美国和俄罗斯,我国的吉林、胜
土地是民生之本,发展之基。在当前大力推进经济社会可持续发展的情况下,城市化和工业化的快速推进就必然伴随着农村土地征地,随之而来的就是产生大量的失地农民,就萍乡市目前
随着科学技术,尤其是传感器技术、信号检测与处理技术以及计算机技术的迅速发展,以及现实系统特别是现代化武器系统的需求,数据融合技术也在迅速发展。为了充分发挥融合系统功能
目前,山西省正处在由农业大省向农业强省迈进的关键时期,而大同市作为山西省第二大城市,发挥着至关重要的作用。随着大同市经济和社会的发展,农民科技培训工作在新时期新形势
为了解黔江区饮用水源地(小南海水库、城北水库和洞塘水库)的水质状况及磷形态分布特征,选择该地区3个饮用水源地为研究对象,通过2015年10月-2016年9月的每月进行水质监测,获
大连北良有限公司作为国有大型粮食流通企业,经过8年的筹组和建设于2000年年底正式竣工投产。公司目前正由建设期转入经营期,公司的发展战略也随着公司任务的转换而发生了重大
<正>中国的第一根光纤、第一根实用化光缆都诞生于此,这里更是行业内首家国家认可第一方检测试验室的所在地。在中国30多年的光纤光缆发展史上,一批批企业被历史的洪流所淹没
通过5根嵌入不同张拉控制应力的碳纤维增强塑料预应力混凝土棱柱体(CFRP-PCPs)复合筋加固钢筋混凝土梁受弯试验,对比分析试验梁的裂缝分布与发展,得到最大裂缝宽度与平均裂缝
2007年以来,中国银行业资本充足率要求的顺周期影响以及逆周期政策问题,受到了学界和决策层的热切关注和重视。中国作为一个体制转型时期的社会主义发展中国家,资本充足率要
拓跋鲜卑建立的北魏政权(公元386——534年)积极效仿魏晋,创设了极为完备的东宫属官系统。北魏的东宫制度与皇储的册封伴随始终,是太子制度的重要组成部分,为增强太子东宫的势力,提