基于文本分析的网络谣言识别研究

来源 :武汉科技大学 | 被引量 : 0次 | 上传用户:a724494702a
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社会生活的发展,互联网正给我们的生活带来巨大的改变。应运而生的微博、微信、Twitter等社交媒体在为人们带来便利的同时,随之迅速蔓延的谣言信息也成为现今亟需解决的一个问题。网络谣言的滋长与扩散给人类生活带来的消极影响,容易激发社会矛盾,影响个人生活甚至是国家和社会的和谐稳定。因此如何在网络谣言进行大面积扩散之前进行及时而准确地识别然后加以制止尤为重要。目前国内的新浪微博是使用人数最多的社交网络平台之一,它的一大特点就是信息的扩散快速且自由,而这一特点却也是为谣言的滋生和传播提供了便利。因此本文以新浪微博作为研究平台来展开对网络谣言识别的研究。首先,虽然目前对网络谣言的研究工作已经相对成熟,但是由于微博平台使用用户的年龄、性别或者文化的差异性,导致不同的主题其实在网络谣言中的占比是不一样的。因此,本文首先基于微博的文本内容对网络谣言进行分析,将网络谣言按照主题进行分类。并在前人提出的网络谣言识别因素(词语特征、符号特征、情感特征、因特征等)的基础上分析各个主题下的谣言识别特征。其次,本文将网络谣言的识别看作一个分类问题,选用一个具体的谣言主题,将提出的特定主题下的网络谣言识别特征进行组合,并且利用数据挖掘软件WEKA来对之前构造的特定主题的网络谣言识别模型进行验证。实验结果表明,基于文本的因素下,采用分主题的网络谣言识别特征对具体的网络谣言识别有较好的效果,即基于特定主题下构造的网络谣言识别特征是有效的。
其他文献
留学生教育是我校高等教育的一个重要的组成部分。在医学留学生《医学细胞生物学》教学中,选编适合医学专业留学生的教材,加强师资的英语培训学习,采取适合留学生学习特点的
目的:探讨富马酸比索洛尔治疗慢性心功能不全患者的临床疗效。方法:选取我院收治的68例慢性心功能不全患者,随机分为治疗组和对照组各34例,对照组患者给以常规治疗,治疗组患者
目的:探讨胺碘酮治疗老年冠心病心律失常的临床疗效。方法:选择2011-05~2013-05我院收治的冠心病心律失常老年患者80例。按照随机性原则将80例患者平均分为研究组与对照组,每组
文章以国家经济发展指标作参照,选取成渝两市近几年经济发展的重要指标为研究对象,与上海、广州、北京三市进行比较分析,依据区位商法(LQ)理论建立数学模型,并利用偏离指数法进
加快推动网络安全和信息化军民融合深度发展,是聚焦网络强国和军民融合两大战略的共振效应,着眼新时代强国强军目标,实现网信领域军民一体、良性互动、协调发展的重要驱动力
期刊
壳聚糖是自然界中存储量仅次于纤维素的生物聚合物,具有来源丰富,环境友好,易生物降解和无毒等优点。因其分子结构中存在大量的羟基和氨基,易与染料分子发生相互作用,被广泛
始建于清朝光绪十一年(1885年)的丰图义仓,位于陕西省大荔县朝邑镇南寨子,该仓于清光绪八年(1882年)由大荔县知名人士东阁大学士阎敬铭倡议始建,慈禧太后御封其为"天下第一仓
随着我国进入经济新常态以来,经济增长速度明显放缓,社会变革加剧,市场中的各个经济主体都面临着经济下行所带来的压力。在此背景下,2018、2019连续两年我国股权投资市场的交易规模与交易数额均呈现下降趋势。固然从宏观经济角度而言,我国经济整体向好趋势没有变,但目前的经济形式仍较为严峻。另外,2019年新个税法正式实施,其中涉及自然人股权转让相关内容的修订,也使得自然人股权转让再次引起大众关注。在此背
对于厘清圆明园百余年的变迁格局而言,样式雷传世图档中的全局图无疑是众多资料中最珍贵的图像,也是甄别其他图档的重要佐证。中国国家图书馆是目前国内收藏样式雷图文档案数