社交网络国民安全突发话题检测、挖掘与演进规律发现

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:Tiki0127
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
伴随着互联网技术的日渐普及,越来越多的用户开始接触社交网络并养成了使用社交网络的习惯。人们关心的日常话题会在第一时间以最快的速度通过社交媒介传播开来,尤其是与人们生活密切相关的国民安全话题。突发话题出现时,大量的相关舆情信息会在以微博为代表的社交网站中传播。为了能够迅速准确地检出相关的突发话题,本论文实现了海量数据的实时采集和突发话题检测、挖掘与演进规律发现系统,采用自然语言处理技术等高效地检测突发话题,并基于检测出的突发话题实现话题挖掘与演进规律发现。本文完成的主要工作如下:(1)提出了社交网络国民安全信息的采集与深度特征提取方法。针对社交网络文本数据存在的语义稀疏性和二义性等问题,提出了基于文本相似度的短文本扩充算法(UCSE)。UCSE算法在对文本进行扩充的基础上利用双向长短期记忆网络,进一步提取了文本深度特征。(2)提出了基于社交网络突发特征识别和过滤的突发话题检测算法(BTDF)。BTDF算法利用微博文本中词的基本权重和突发权重,识别出突发特征。通过对微博文本的短时间和长时间前置信息的分析,过滤伪突发特征。结合识别出的突发特征和当前时间片话题发现的结果,检测出突发话题。实验结果表明提出的BTDF算法能够准确有效地检测出突发话题。(3)提出了突发话题挖掘与演进规律发现算法,实现了对突发话题不同时间片内话题特征的挖掘。话题的特征通常包含话题热度、关键词等特征。通过挖掘话题周期内微博的评论数、点赞数、博文数的变化,进行热度的演进规律发现。通过结合微博文本中词的语义相关性和共现关系,提取文本关键词。通过展示话题不同维度的话题特征随时间序列的变化,实现了演进规律发现。(4)设计并实现了社交网络国民安全突发话题检测、挖掘与演进规律发现系统。验证了所提出的算法的可行性和有效性。系统共包含四个模块:社交网络数据采集与深度特征提取模块、国民安全突发话题检测模块、突发话题挖掘与演进规律发现模块和系统展示模块。
其他文献
直流电弧等离子体法作为一种制备高纯度石墨烯的有效方法,具有操作安全简易、环境友好和制备效率高等优点,且可以通过改变实验条件对石墨烯的尺寸与层数进行控制。但石墨烯的生长机理不同于碳纳米管,其制备过程无需催化剂,无法从催化剂成核的角度来解释其生长机理。另一方面,电弧等离子体具有高温特性和复杂的电磁相互作用,导致关于等离子体性质的研究难度较大,这也是电弧法制备石墨烯的生长机理尚未得到定论的原因。针对以上
在自然语言处理领域,古诗自动生成的研究成为了一项富有挑战性的工作,吸引着许多的专家学者加入到研究队列中。古诗自动生成的研究是对中国传统文学文化的一种推广和传播,同时对中文自然语言处理的发展也极具意义。本文主要基于对抗训练和强化学习的思想,对关键词生成古诗和图像生成古诗进行研究,主要工作如下:一、提出一种基于多对抗训练的序列生成古诗的方法。设计了具有双编码器的序列到序列生成模型,通过注意力机制对关键
移动通信技术的发展让人们对卫星通信提出了更高的需求。构建具有广覆盖、高传输速率的星地融合网络势在必行,地面5G移动通信系统与低轨(Low Earth Orbit,LEO)卫星移动通信系统的融合在其中扮演着重要的角色。正交频分复用(Orthogonal Frequency Division Multiplexing,OFDM)技术以其频谱利用率高、资源分配方式灵活、便于与其他技术融合以及与地面移动通
资金如同企业的血液,企业的生产发展离不开资金的支持。信息不对称、代理问题的存在导致外部融资成本往往高于内部融资成本,从而对企业资金使用造成限制,形成融资约束。企业
随着环境问题的日益严重,人与自然的关系成为人类社会当前面临的最为重要的议题之一。单一主体的绿色行动对环境治理问题的作用有限,绿色治理作为一种新的治理观被提出。绿色治理强调多元治理主体的协同作用,而企业是绿色治理最为关键的行动者。钢铁工业是中国国民经济最为重要的基础产业之一,同时也是高污染、高能耗的行业。近年来,在国家大力推进生态文明建设的大背景下,钢铁企业的能耗比重有所降低,污染物排放量也得到控制
大学生是新时代青年的代表,在思想方面,必须坚定理想信念,做讲政治的新青年。在思想政治教育学习中,大学生切实有所得、有所感,有助于大学生构建正确的认知结构。本文详细阐述了思想政治教育获得感内涵、大学生思想政治教育获得感现状及如何提升大学生思想政治教育获得感。并以马克思主义人学理论和心理学学习理论为理论基础,根据心理学学习理论中的认知主义、人本主义和行为主义分析出思想政治教育获得感的基本构成。以认知、
机械装配质量直接影响机电产品的整体质量,其检测是复杂机电产品制造质量保证的重要组成部分。现代机械制造正朝着轻量、高速、高效、高精度、智能化的方向发展,这对装配质量检测提出了更高的要求。如何建立一套功能全面且操作简便的检测指标与规范方法,是机械装配质量检测领域的重要问题。目前,常规的机械装配质量检测主要集中在诸如公差与尺寸协调性等的“静态质量”指标,尚缺乏装配“动态质量”的关注和研究,这不利于产品整
随着5G通信时代的到来,人工智能、云计算和物联网等相关行业的不断壮大,越来越多的数据以流的形式增长。由于数据随时间不断涌现,因此难免出现结构分布改变的现象,即概念漂移
自古以来,知阴谋、善使阴谋者大有人在。关于如何使用阴谋的书籍在西方著作中以《君王论》为代表,而东方著作更是络绎不绝:自《鬼谷子》一书宣扬趋炎附势,讲究为达目的,誓不
本文基于提高税收风险管理水平的要求和热力行业增值税管理的现实状况,对热力行业增值税税收风险识别进行研究。首先对热力行业生产经营规律和增值税管理现状做了简要介绍,深入分析当前热力行业增值税税收风险产生的原因,归根结底是由于缺少一套科学有效的税收风险识别模型,归纳整理税收风险的主要表现和这些表现在税务机关掌握数据上的反映,为税收风险识别模型的建设打好基础。为了能够更加准确有效地建立热力行业增值税税收风