基于LSTM情感分析模型的微博谣言识别方法研究

来源 :华中师范大学 | 被引量 : 0次 | 上传用户：liongliong563

【摘要】

：

微博是一个开放性和自由度比较高的互联网社交平台,人人都可以在上面发布和接收信息,由于微博信息体量的庞大以及极低的准入机制,给信息的交流带来了巨大的便利,同时也存在着

【作者】

：

陈帆

【出处】

：

华中师范大学

【发表日期】

：

2018年期

【关键词】

：

谣言识别 LSTM 情感分析高斯核函数支持向量机

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

微博是一个开放性和自由度比较高的互联网社交平台,人人都可以在上面发布和接收信息,由于微博信息体量的庞大以及极低的准入机制,给信息的交流带来了巨大的便利,同时也存在着大量的谣言。谣言产生与传播带来的负面效应,极大影响了国家、社会的和谐稳定和个人生活,因此如何能自动有效地识别出微博谣言,一直是相关领域的一个研究热点。传统的微博谣言识别研究主要被看作一个有监督学习过程的二分类问题,其工作重点在于相关特征的选择上,主要有基于情感词典的微博情感、用户属性等浅层次的特征,更深层次的特征并没有得到充分挖掘,如微博发布来源的可信度,微博评论的情感倾向以及微博传播的结构特点等,因而谣言识别的效果有限。基于此,本文分析了微博谣言从产生经传播最后到信息接收者面前的全过程,提出了一种基于深度学习LSTM模型的谣言识别策略,用于微博特定主题的谣言识别,具体工作如下:首先,本文提出了一种微博来源的可信度高低的界定方法。由于目前对于谣言的来源缺乏有效的鉴定和追本溯源的手段,本文从微博谣言产生的源头入手,根据发布微博的用户特征,给不同特征赋予可信度权值,构建界定微博发布来源可信度高低的方法。然后从微博社区公布的不实信息中采集特定主题的谣言信息,并采集其发布者信息以及评论和转发信息作为谣言集,同时采集正常微博对应的相关信息作为非谣言集,共同构成本文实验的样本集。其次,针对微博的相关评论和传播等深层特征,本文使用基于情感词典的方法来获得评论的情感特征,通过构建树形结构来模拟微博的传播结构,然后使用基于高斯核函数的支持向量机来训练模拟数据,从而得到谣言和非谣言微博不同的传播特征,然后将上述特征加入到谣言识别模型中,以提高谣言识别的准确度。最后,由于大量微博谣言具有明显的情感倾向,本文采用LSTM模型对微博文本进行情感分析,构建基于LSTM情感分析的微博谣言识别模型,通过对比高低可信度来源的微博语料在情感倾向上产生的冲突和差异,同时加入微博评论和传播特征来识别谣言。实验证明,上述方法对微博谣言具有较好的识别效果。

其他文献

重症肺炎患者血清中sTREM-1、纤维蛋白原及D-二聚体水平变化及临床意义

目的分析重症肺炎患者血清中可溶性髓系细胞触发受体1（sTREM-1）、纤维蛋白原（FBG）及D-二聚体（D-D）水平变化及临床意义。方法回顾性分析我院2015年1月-2017年7月收治的76例重症肺炎

期刊

重症肺炎可溶性髓系细胞触发受体1纤维蛋白原D-二聚体临床意义

“五勤”班主任的基本模式

在班级工作中，班主任的决策与管理、组织与协调、教导与服务的多重角色地位，决定了他（她）必须具备一套符合社会、家庭等需要的角色行为。但长期以来，许多班主任却对自身角色及其行

期刊

班主任基本模式行为模式管理水平业务素质角色规范化社会

四川省融入中蒙俄经济走廊发展的建议

“中蒙俄经济走廊”是“一带一路”倡议的六大经济走廊之一,2016年9月《建设中蒙俄经济走廊规划纲要》正式发布。四川处在连接我国西南西北、沟通南亚东南亚中亚,连通中蒙俄

期刊

中蒙俄经济走廊四川南北通道

中国舞蹈产业化的发展创新探析

在时代的发展中,文化是一个国家、一个民族强盛的根本,应当高度重视文化产业的发展建设。党的十九大明确指出文化自信对于民族兴盛的关键作用,正所谓文化强则民族强。所以,现

期刊

舞蹈产业化发展创新

学生:作为课程资源

ue＊M＃’＃dkB4＃＃8＃”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:（100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技

学位

学生课程资源课程资源开发

论社会医疗保险欺诈现象

在社会医疗保险制度运行过程中,保险欺诈现象一直广泛存在。本文重点透析了社会医疗保险欺诈的形成原因及保险欺诈对社会医疗保险运行的危害,在此基础之上探讨了一些反制措施

期刊

社会医疗保险保险欺诈成因

基于LSTM情感分析模型的微博谣言识别方法研究

其他学术论文