基于LSTM情感分析模型的微博谣言识别方法研究

来源 :华中师范大学 | 被引量 : 0次 | 上传用户:liongliong563
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
微博是一个开放性和自由度比较高的互联网社交平台,人人都可以在上面发布和接收信息,由于微博信息体量的庞大以及极低的准入机制,给信息的交流带来了巨大的便利,同时也存在着大量的谣言。谣言产生与传播带来的负面效应,极大影响了国家、社会的和谐稳定和个人生活,因此如何能自动有效地识别出微博谣言,一直是相关领域的一个研究热点。传统的微博谣言识别研究主要被看作一个有监督学习过程的二分类问题,其工作重点在于相关特征的选择上,主要有基于情感词典的微博情感、用户属性等浅层次的特征,更深层次的特征并没有得到充分挖掘,如微博发布来源的可信度,微博评论的情感倾向以及微博传播的结构特点等,因而谣言识别的效果有限。基于此,本文分析了微博谣言从产生经传播最后到信息接收者面前的全过程,提出了一种基于深度学习LSTM模型的谣言识别策略,用于微博特定主题的谣言识别,具体工作如下:首先,本文提出了一种微博来源的可信度高低的界定方法。由于目前对于谣言的来源缺乏有效的鉴定和追本溯源的手段,本文从微博谣言产生的源头入手,根据发布微博的用户特征,给不同特征赋予可信度权值,构建界定微博发布来源可信度高低的方法。然后从微博社区公布的不实信息中采集特定主题的谣言信息,并采集其发布者信息以及评论和转发信息作为谣言集,同时采集正常微博对应的相关信息作为非谣言集,共同构成本文实验的样本集。其次,针对微博的相关评论和传播等深层特征,本文使用基于情感词典的方法来获得评论的情感特征,通过构建树形结构来模拟微博的传播结构,然后使用基于高斯核函数的支持向量机来训练模拟数据,从而得到谣言和非谣言微博不同的传播特征,然后将上述特征加入到谣言识别模型中,以提高谣言识别的准确度。最后,由于大量微博谣言具有明显的情感倾向,本文采用LSTM模型对微博文本进行情感分析,构建基于LSTM情感分析的微博谣言识别模型,通过对比高低可信度来源的微博语料在情感倾向上产生的冲突和差异,同时加入微博评论和传播特征来识别谣言。实验证明,上述方法对微博谣言具有较好的识别效果。
其他文献
目的分析重症肺炎患者血清中可溶性髓系细胞触发受体1(sTREM-1)、纤维蛋白原(FBG)及D-二聚体(D-D)水平变化及临床意义。方法 回顾性分析我院2015年1月-2017年7月收治的76例重症肺炎
在班级工作中,班主任的决策与管理、组织与协调、教导与服务的多重角色地位,决定了他(她)必须具备一套符合社会、家庭等需要的角色行为。但长期以来,许多班主任却对自身角色及其行
鳡鱼属鲤科、雅罗鱼亚科,又称潢鲇、横鱼、鳡鳅。生活在江河、湖泊的中上层,游泳迅速,行动敏捷,是一种主要以鱼类为食的典型的凶猛鱼类,也是大型的淡水经济鱼类。该鱼生长快
“中蒙俄经济走廊”是“一带一路”倡议的六大经济走廊之一,2016年9月《建设中蒙俄经济走廊规划纲要》正式发布。四川处在连接我国西南西北、沟通南亚东南亚中亚,连通中蒙俄
在时代的发展中,文化是一个国家、一个民族强盛的根本,应当高度重视文化产业的发展建设。党的十九大明确指出文化自信对于民族兴盛的关键作用,正所谓文化强则民族强。所以,现
本文建立了长白山区玉米、水稻和大豆的气候可能产量模式和地理分布模型,计算了各地的气候生产潜力,并进行了地形影响订正。结果表明,长白山区主要农作物气候生产力的地理分
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
在社会医疗保险制度运行过程中,保险欺诈现象一直广泛存在。本文重点透析了社会医疗保险欺诈的形成原因及保险欺诈对社会医疗保险运行的危害,在此基础之上探讨了一些反制措施
<正> 2001年我店鱼药销售额比2000年减少了25%,主要原因有四个:一、珠三角水产养殖面积大大减少与转移为外延农业。很多鱼塘被征收填土、扩建、筑路、改种花卉等,鱼塘今后还