基于深度学习的网络舆情文本倾向性分析系统的研究与设计

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:yuechao002
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在大数据时代背景下,信息技术和计算机的使用逐渐常态化,尤其是手机使用的迅速普及,使得网络成为获取信息并且发表意见的重要渠道。而网络舆情就是因为某些事件的发生而在网络上被众多群众讨论而形成的。近年来,深度学习情感分析被大量应用于文本资料分析,但大部分都是对电影或者商品评论进行分析,很少有分析中文文本倾向和网络民意收集的。因此为了判断群众对事件的意见倾向,帮助政府在一定特殊时期及时做出相关决策,分析网络舆情的文本倾向性意义重大。为了及时掌握社情民意的情感倾向,本文研究设计了一个基于深度学习的文本倾向性分析系统。拟使用网络爬虫爬取特定网站的网络舆情文本信息,将语料进行预处理,通过深度学习对网络舆情文本信息进行正负倾向判定。论文给出了系统的总体架构,重点对几种不同的深度学习框架在网络舆情倾向预测的有效性进行了研究。论文给出了系统的总体架构,重点对集中不同的深度学习框架在网络舆情倾向预测的有效性进行了研究。本文利用某部门已经人工标注的舆情倾向数据库作为标准数据集(含99168条舆情文本),使用不同的深度学习框架LSTM、BLSTM、GRU、CNN对数据进行训练和验证,并对框架中的激活函数(sigmoid、tanh、ReLu)和优化器(Adam、AdaGrad)进行训练和测试,以找到适合舆情预测的最优组合。并利用CNN特征提取能力较强,而BLSTM能够读取上下文的特性,将CNN和BLSTM进行组合,构建了CNN+BLSTM、CNN+LSTM和CNN+GRU框架,和基础的4个框架,共构成42种组合,用验证准确率、验证损失率、是否出现过拟合现象以及消耗时间为评估依据,寻找最优框架及组合。实验结果显示,不同激活函数和优化器对模型影响很大,但sigmoid激活函数最适合本系统。而验证准确率最高的模型是CNN(sigmoid+Adam),为97.84%,其次是CNN+BLSTM(sigmoid+AdaGrad)模型,验证准确率为97.72%。激活函数sigmoid搭配优化器AdaGrad时,CNN+LSTM的验证准确率为97.5%,证明组合模型CNN+BLSTM、CNN+LSTM在使用激活函数sigmoid搭配优化器AdaGrad时分类效果优于单独的模型。综合分析发现,虽然CNN+BLSTM的验证准确率较高,但是其耗时太长,实际应用会严重影响时效性,并且激活函数和优化器不同结果差距较大。而7个模型中只有LSTM模型的6种组合验证准确率均超过95%,并且耗时较短,准确率也较高,损失率较低。因此本文认为LSTM模型比较适合应用于实际应用。最后本文利用LSTM模型对“西安禁烟”微博话题进行了实际测试分析,其准确率为89.58%,分析发现其中含有反讽语气和有错别字的语句判断错误,原因可能是训练模型的数据来源大多数是正面新闻报道,网民表达想法的微博数据占比较小,因此利用LSTM模型基本能够正确判断意见倾向。
其他文献
低压电力线通信技术因其不需要重新铺设线路,经济成本低,成为了低压电力系统安全稳定运行的重要保障。但是,低压电力线通信信道中存在大量噪声,对低压电力线通信系统破坏非常
目的:对遗传代谢病高危儿的串联质谱及气相色谱血尿遗传代谢病筛查结果进行分析,为临床诊断提供参考。方法:回顾性分析1395例(男836例、女559例)疑似遗传代谢病高危儿的质谱
近年来,我国供水管网的建设与改造已经取得了一定的成就,但管网漏水、爆管,供水压力不足,水质不达标和二次污染等问题依然普遍存在,给人们的生活和生产造成了不利影响。如何
<正> 目前,水产养殖业发展很快,特别是普通淡水鱼更成为人们日常不可缺少的食品,普通淡水鱼饲料也成为饲料厂的一个重要产品。 水产饲料(包括虾饲料、高档鱼饲料及普通淡水鱼
规划或任务的落实或实现,关键在于单位执行力,本文探讨基层单位执行力弱的表现、成因,提出提高基层单位执行力的对策。
冈察洛夫在长篇小说《奥勃洛莫夫》中所塑造的“奥勃洛莫夫性格”是一种典型的俄罗斯民族性格。对于该性格的讨论与解读不应仅停留在以杜勃罗留波夫观点为代表的社会政治视角
本文利用柏同区域水库沉积物及土壤培养黑藻,分析不同底质培养下黑藻生长的变化,揭示不同底质对沉水植物生长状况的影响。结果表明,本试验条件下,土壤与营养水平相当的沉积物相比
《电工基础》是以实验为主要手段进行教学的一门基础课程,这与其它课程的教学有明显的不同,利用多媒体有助于提高学生的学习兴趣、突破教学难关、弥补演示实验的不足,但多媒体在
案例教学作为一种富有生命力的教学模式,随着教学条件的变化,案例教学模式出现了更加灵活化的趋势,技工学院的管理类课程引入案例教学法,可以极大促进学生的学习积极性,但是也存在
目的:对方格星虫的抗氧化活性进行研究。方法:方格星虫匀浆后于室温下用乙醇提取,然后用乙酸乙酯和水萃取,得到不同极性的提取物,分别对提取物进行抗氧化检测,同时与合成的抗氧化剂