基于深度学习的新冠疫情网络舆情监测系统的设计与实现

来源 :中北大学 | 被引量 : 0次 | 上传用户:shl405567051
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息化技术的发展和成熟,互联网已经在精确化和智能化的方向上得到了长足的发展,具有信息多样性、传播即时性和全民互动性等特点。2019年12月,新冠疫情突然爆发,随后席卷全球,其相关话题时至今日依然是全球关注的热点话题。新冠疫情相关舆情以新浪微博为代表的网络社交媒体平台为媒介,裹挟着网民们的情感迅速传播,消极的情感极易造成恐慌情绪,影响互联网生态和社会的稳定。因此及时把握舆情走向,正确引导舆论情感成为维稳工作的重中之重。随着深度学习技术的普及和发展,计算机能够更加高效的处理文本数据,逐步取代了舆情监测的人工模式。本文实现了一种基于深度学习的新冠疫情网络舆情监测系统,本文主要工作包含如下几个方面:(1)数据采集与预处理:针对缺少新冠疫情情感数据集的问题,本文采用Scrapy分布式爬虫框架,设计并实现了新冠舆情相关微博文本的爬取。将数据集进行情感倾向标注并采用正则表达式、jieba分词、哈工大停用词表等数据预处理方法对原始数据进行清洗、分词、去停等预处理,最终得到情感倾向识别所需的数据。(2)情感倾向识别:针对微博文本长短不一、多流行用语的特性,为了能更好地完成舆情监测任务,本文提出了基于BERT-BiLSTM的情感倾向识别模型。BERT(Bidirectional Encoder Representations from Transformers)预训练语言模型能够从多个维度生成更丰富的语义特征信息;双向长短时记忆网络(Bidirectional Long Short Term Memory,BiLSTM)模型在文本上下文的特征提取的能力上更优,最后经过全连接层和softmax分类器后输出情感倾向识别结果。BERT-BiLSTM模型有机结合了两个模型的优点,可以同时满足局部和全局特征信息的提取。将该模型与其他深度学习模型进行对比实验分析,证明了该模型在情感倾向识别任务里的有效性和优越性。(3)系统实现:通过对舆情监测系统的需求分析,选定系统开发工具,设计并实现系统。新冠疫情网络舆情监测系统功能主要包括用户注册登录、舆情概况总览、情感倾向分布、舆情词云展示等。各个功能模块以可视化图表的形式呈现给用户,提高了用户的整体使用体验。
其他文献
现有的盆底超声图像细节增强方法在增加过程中对灰度值把握能力较差,容易出现细节丢失的问题,甚至会出现过度增强。为了解决上述问题,基于直方图均衡插值研究了一种新的盆底超声图像细节增强方法。利用频域高斯滤波和傅里叶变换方法将图像分为高频图像和低频图像,通过直方图均衡处理结果分析相邻灰度值幅值,引入新的灰度值,从而得到新的直方图。以从小到大的顺序确定映射关系,融合处理后的低频图像和高频图像,确保细节可以得
【目的】通过调查和研究冬奥场馆周边小流域人工林枯落物层和土壤层水文性能的变化规律及差异性,为研究区人工林的恢复、经营以及水源涵养能力的提升提供理论支撑。【方法】以崇礼区西沟流域的5种人工林配置模式(落叶松纯林、樟子松纯林、落叶松柠条混交林、樟子松柠条混交林和樟子松落叶松柠条混交林)为研究对象,通过测定林内枯落物层和土壤层特征,定量分析和比较不同配置模式枯落物和土壤的水文特征。【结果】(1)不同人工
<正> 引言以射流泵为挖泥工具的挖泥船称为喷射式挖泥船。图1喷射式挖泥船射流泵主要由喷咀、喉管、扩散管以及吸管等组成(图2)。其工作原理是一定压力的液体(称为工作液体),经由喷咀以高速喷射出来,在这一过程中液体的压力能转化为动能,因而形成真空。被吸
期刊
目的:研究DRG付费方式下公立医院结余的结构及成因,探讨医院可持续发展的运营策略。方法:将住院产生的医院结余拆分成医疗结余和医保结余两部分,通过公式组合、推导,找到影响医院结余的关键因素。结果:形成医院结余的因素受医保机构结余留用政策影响,当医保结余全部归医院留用时,医疗成本是影响医院结余的唯一院方可控变量;当医保结余部分归医院留用时,医疗收入和医疗成本同为影响医院结余的院方可控变量。结论:在DR
内部审计是我国特色审计体系的重要部分,在审计全覆盖的形势下,社会和企业对内部审计的增值期望逐渐增强,我国增值型内部审计开始步入了深层次发展阶段,不断探索和归纳增值路径。业审融合正是企业为了实现内部审计全覆盖的有效探索,是目前内部审计保驾企业价值增加的新路径,形成了新的内部审计模式,逐渐成为企业内部审计探索应用的方向。现阶段,国家电网正依托数字经济高度发展的东风,聚力数字化转型,为“业审融合双联动”
目的:观察揉捏牵转法联合优化推拿手法治疗先天性肌性斜颈(Congenitalmuscular torticollis,CMT)的临床疗效。方法:86例分为观察组和对照组各43例。两组均用优化推拿手法治疗,观察组加用揉捏牵转法治疗。结果:观察组总有效率高于对照组(P<0.05)。治疗后观察组耳肩距、健侧颌肩距高于对照组(P<0.05),患侧颌肩距低于对照组(P<0.05)。治疗后观察组肿块厚度、胸锁
医学影像技术和计算机视觉的发展,为乳腺癌的诊断提供了强有力的帮助。在医学图像分类中,乳腺癌病理组织的复杂性和多样性给病理图像准确分类带来了不小的阻碍,如何有效地利用病理组织图像的特征信息为癌症组织病理图像分类提供可靠的依据,现已成为研究领域的焦点;另一方面,由于医学图像的特殊性,大规模且标注准确的医学图像数据比较稀少,导致医学图像分类出现了数据依赖问题。针对上述挑战,本文提出了基于深度学习和迁移学
分片技术是区块链用来解决可扩展性问题的主流技术之一。通过分片技术可以有效地提升区块链的吞吐量,然而由于子链算力分布不均导致区块链安全性差。为了降低网络分片引起的子链合谋攻击风险,提出基于一种抗合谋攻击的区块链网络分片算法(anti-collusion attack network sharding algorithm for blockchain,AANS)。该算法综合考虑节点行为特征及算力特征,
经济管理对于提高公立医院运营效率,提高医疗质量都具有重大的意义,在新医改形势下,推进公立医院经济管理,是落实现代医院管理制度的重要抓手。当前我国深化医改进入深水区和攻坚期,公立医院管理模式面临从粗放式走向精细化的重大转变,文章从新医改形势下公立医院经济管理的重要性入手,具体分析公立医院经济管理现状及存在的问题,探讨解决问题的思路与对策,并提出公立医院在新医改形势下,要进一步提高经济管理认识,以新发