基于多粒度图卷积网络的假新闻检测

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:lkjall
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网社交平台的迅速崛起,极大提升了网络信息传播的效率,但传播途径的便捷也助长了虚假新闻的生成和传播。假新闻不仅会使媒体的可信度减弱,还可能危害政治和经济等领域,造成社会秩序的混乱,影响人们的正常生活。从繁杂的网络内容中自动检测出假新闻是一个亟需解决的实际自然语言处理问题,具有减轻甚至消除假新闻负面影响的积极意义。假新闻是指带有不真实成分的言论或报道,事件的实情往往与描述有所出入,常因政治或经济利益被发布,较难对其进行准确识别。由于推特、微博等社交平台的新闻内容较为简短,仅考虑新闻内容及其语言特征,无法取得令人满意的检测效果,需高效准确的模型对该类新闻进行检测识别。利用有限的信息进行虚假新闻的自动检测识别是目前假新闻检测领域的一个重大挑战。为利用有限的信息提升检测性能,已有的大部分研究基于样本间的独立性假设开展,将文本与其他非本文特征同时输入模型编码学习,通常忽略了新闻间的相似性,这一可能提升分类表现的因素。本文主要研究了新闻内容较为简短的情况下,有效利用丰富的非文本信息辅助假新闻检测的问题。由于网络社交平台的文本更为简短,具有信息内容含量少、表达形式多样和结构成分不完整的特点,为充分利用新闻的非文本辅助信息提升检测性能,本文提出了一种利用新闻在不同上下文特征的相似性进行假新闻检测的半监督学习框架。该框架从新闻样本的关系入手,将新闻样本视作图网络中的独立节点,利用丰富的非文本辅助信息确定边权,构建多维关系图网络结构。针对图卷积网络在结合邻居信息及学习表示方面的不足,提出改进的多粒度图卷积网络充分结合不同距离邻居的特征,捕获单个关系图中不同粒度的信息;通过显式保留节点丰富的多粒度信息的方式,提高每个节点表示的多样性。最后通过注意力机制进行信息融合,提升不同粒度信息表达的一致性,融合生成泛化能力更强的节点表示。在假新闻检测领域最大的公开基准数据集LIAR上进行的实验表明,基于多粒度图卷积网络的假新闻检测框架能够利用新闻节点的不同粒度相似性区分新闻的真假程度,提出的M-GCN模型取得了较好的分类表现,验证了该检测框架的有效性。
其他文献
在超宽带穿墙雷达成像应用中,压缩感知理论应用可以获得高分辨率稀疏成像。但这必须建立在目标恰好落在预设网格点的前提条件下,一旦目标偏离预设网格点,目标像会发生偏移,甚
本文通过对区域的判断,确定区域经济社会发展正处大机遇,并根据区域内的资源优势,确定赶超队伍的目标,分析了优化赶超队伍的成本,打造时代团队,将时代团队放在时代环境中去优化赶超
1937年七七事变之后,日军为了迅速占领华北地区,推进山西作战。10月初,日军第一军令其第5师团在忻口地区作战,第20师团作为策应部队沿正太线侵入,由此娘子关攻防战在正太线沿
近年来,航空航天领域中结构件的轻量化需求越来越迫切,铝锂合金因兼具低密度,高弹性模量、比强度等优点,具有广阔的发展前景。然而,铝锂合金存在室温塑性差、回弹大、成形后
中国古典园林被称为是“天然图画”,是集时间、空间以及众多艺术形式于一体的综合艺术。古代许多造园家往往也都兼具着画家的身份,他们在建造园林时,以自然山水为依托、以山水画为蓝本、以画论为指导思想,追求可行、可望、可居、可游的“入画”之景。画家又以园林为画本来作画,两者相辅相成,相互渗透,使园林“风景如画”又能“入画”。山水画在过去的很长一段时间里指导和影响了古代园林的营造,当今社会高速发展、国家繁荣富
掠夺性定价是反垄断法规制的重点行为之一。作为一种新经济模式,互联网平台经济在我国的市场经济中扮演着越来越重要的角色。互联网平台经营者是平台市场中受到双边市场竞争约束的主要主体。在互联网平台市场中,涉嫌掠夺性定价的低价行为时有发生。产业组织理论的发展为互联网平台经营者掠夺性定价的反垄断规制提供了经济学工具。在新经济模式下,如何结合新经济学理论有效区分平台经营者正当的低价竞争与违法的掠夺性定价成为重大
20世纪60年代,在多重因素的作用下,美国爆发了城市危机,主要表现为黑人种族骚乱。从特点来看,此次危机波及全国各大城市,对城市财产造成严重损失,并且骚乱发生时间多集中于夏