基于情感分类的网络舆情分析系统的研究与实现

来源 :东南大学 | 被引量 : 0次 | 上传用户:sb37sb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当前社会互联网已经成为人们获取信息的重要途经,网络舆情的监测也愈发重要,如何分辨出负面情感倾向的舆情信息是网络舆情管理的重点。面对海量的舆情数据,人工分类的效率过于低下,必须借助舆情分析论文进行分析。常用的舆情分析系统一般采用基于关键词的舆情分析技术,这种技术在处理中文舆情信息时,由于中文的多义词和文本语序对语义的影响导致分类准确性不高。随着自然语言处理技术的发展,机器学习逐渐成为舆情分析领域新的热点研究方向,不只是通过关键词,而是通过分辨舆情的情感倾向来实现对可能引起舆论危机的舆情进行监控。不同机器学习算法的舆情情感分类能力不同,不合适的方法不仅无法有效分析舆情,反而会增加分析难度。因此,本文设计了基于BERT模型的舆情情感分类模型来分类出负面舆情,再使用基于DBSCAN的舆情话题聚类方法提取热点负面舆情话题,最终设计并实现了原型系统以实现对网络舆情的分析。本文的具体工作如下:(1)提出了基于BERT的网络舆情情感倾向分类模型。利用BERT模型生成网络舆情数据的词向量,根据模型训练数据集数量的多少选择合适的分类模型对舆情词向量进行情感倾向分类,最后分类出负面情感倾向的舆情。(2)提出了基于DBSCAN的网络舆情话题聚类方法。首先对负面舆情信息进行预处理:分词、去停用词;同时使用TF-IDF算法生成特征词权重表,使用Simhash算法和特征词权重表构建负面舆情信息的文本特征;最后使用DBSCAN算法对文本特征进行聚类,从聚类得到的类簇中提取热点舆情话题。(3)设计并实现了一个网络舆情分析原型系统,从工程应用角度介绍了本系统从模型训练模块、舆情分类模块、舆情聚类模块和舆情信息分析模块的一系列功能,并测试系统分类和聚类性能。
其他文献
目的:本研究旨在探讨非酒精性脂肪性肝病(non-alcoholic fatty liver disease,NAFLD)对结直肠癌(colorectal cancer,CRC)同时性肝转移风险的影响,并进一步分析NAFLD中进展期纤维化及肝硬化阶段对同时性肝转移患病率的影响。方法:回顾性分析2014年01月至2019年01月于东南大学附属中大医院连续入院的全部初诊CRC患者共451例。为了排除CR
目的:脑转移是非小细胞肺癌(non-small cell lung cancer,NSCLC)的常见并发症,严重影响患者生存和生活的质量。本研究旨在评估脑梗死对NSCLC患者脑转移风险的影响,从而为脑转移的防治提供理论依据。方法:回顾性分析东南大学附属中大医院2013年7月至2018年7月收治的307例新诊断的NSCLC患者的临床资料。脑梗死的诊断标准参照《面向21世纪的卒中新定义:美国心脏病学会
目的:分析我院2年内接受根治性远端胃切除术胃癌患者的临床资料,评估其焦虑、抑郁程度,探讨焦虑、抑郁与胃癌术后胃瘫的相关性。方法:分析自2017年8月至2019年11月期间在东南大学附属中大医院接受根治性远端胃切除术患者的临床资料。根据纳入和排除标准共纳入胃癌患者69例,其中发生胃瘫10例(14.5%)。手术前一天分别采用焦虑自评量表(SAS)和抑郁自评量表(SDS)对患者进行焦虑、抑郁程度测量评分
背景近年来,颈椎相关疾病发病率呈上升趋势。随着手术技术及相关器械的不断进步,颈椎后路成为治疗颈椎疾病的重要手术入路。手术部位术后感染是常见的颈椎后路手术并发症之一,早期不易诊断,一旦发生可能造成伤口不愈合、中枢系统感染等后果。对于颈椎后路手术术后切口感染的危险因素,仍有部分因素缺乏有力的临床证据,因此,本文旨在进行颈椎后路手术手术部位术后感染的危险因素分析。方法运用回顾性分析的方法,回顾东南大学附
2001年,美国成功推翻了阿富汗塔利班政权,但却未能完成阿富汗的重建。2021年8月15日,时隔20年,塔利班成功返回喀布尔。这一戏剧性变化让国际社会强烈要求塔利班必须有序建立一个温和、包容的政府,同时切断与极端组织的一切联系。由于阿富汗的地缘优势及其地理位置与中国毗邻,中阿两国不仅需要传承睦邻友好关系,而且中国意图在阿的国家重建中发挥建设性作用。面对美国已把中国视为全面战略竞争对手的国际环境,中
基于雪崩光电二极管(Avalanche Photodiode,APD)的单光子探测系统在军事、光谱测量、生物发光和光纤传感等方面具有广阔的应用前景,随着对探测速度的要求越来越高,门控淬灭作为单光子探测的一种控制方式,门控时钟的频率往往决定了单光子探测的最高速率,因此,频率达到1GHz以上的门控时钟对高速单光子探测系统起着至关重要的作用。为满足单光子探测对门控时钟的要求,本文基于闭环锁频环结构(Fr
目的:评价二甲双胍治疗儿童和青少年肥胖的疗效。方法:在Pubmed、Cochrane Library、Web of science、LILAC、EBSCO HOST和CNKI数据库中搜索相关文章。本研究中包括了15个评估二甲双胍相对于安慰剂/对照药物疗效的随机对照试验。实验对象包括19岁及以下的临床诊断为肥胖症而且没有引起肥胖症的病理基础或与肥胖相关的合并症的儿童和青少年。主要结果是体重指数的变化
目的:分析危重孕产妇的临床资料及围产结局,探讨危重孕产妇入住ICU的高危因素,为其早期识别、早期干预提供临床依据。方法:采用临床病例对照研究的方法,回顾性收集东南大学附属中大医院2016年01月至2019年12月入住产科及ICU危重孕产妇136例临床资料,纳入标准为2009年WHO推荐评估危重孕产妇(maternal near miss,MNM)的诊断标准。其中入住ICU组76例,未入住ICU组6
研究背景:颈椎病(cervical spondylosis)是一种常见的脊柱外科疾病,发病率逐年上升,且呈现年轻化趋势。传统颈前路钢板椎间融合系统是治疗颈椎病的一种经典手术方式,疗效得到肯定,但其缺陷日益明显。因零切迹颈前路椎间融合系统(Zero-Profile interbody fusion device,Zero-P)具有术后对食管机械刺激小、显著降低术后吞咽困难发生率及严重程度、降低相邻节
前言胰腺坏死积聚是急性胰腺炎重要局部并发症之一,随着目前治疗手段逐渐成熟,微创阶梯式引流的治疗模式已被国际国内专家广泛接受,目前国际胰腺炎指南推荐的干预时机仍存在争议,因此本课题通过以下两个部分探讨胰腺坏死积聚的干预时机对患者临床预后的影响,期望得到对于不同严重程度的急性胰腺炎患者合适的个体化干预时间。第一部分对坏死性急性胰腺炎并发持续性器官功能衰竭患者的早期和延迟干预对比背景:目前国际胰腺炎指南