基于LSTM双通道字词特征融合的微博评论情感分类研究

来源 :燕山大学 | 被引量 : 0次 | 上传用户:sese4546
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网时代的兴起,人们更加青睐于通过网络发表个人言论,同时负面舆论也在互联网上如病毒一般急速蔓延。微博作为一种使用较广的信息获取和交流沟通工具,是反映网络舆情的重要媒介,其热点话题下面的评论反映大家对该话题的情感倾向。微博评论情感分类有利于舆论监督、维护网络环境安全,也为政府制定相关政策提供参考。本文研究了基于深度学习的微博评论情感分类,主要工作如下。首先,针对微博中使用图片进行评论以躲避系统检测的问题,采用基于tesseract的光学字符识别技术将图片的文字转化为文本信息,解决微博图片评论不能直接被文本识别系统检测问题。同时,介绍了传统的文本表示方法、word2vec和词频逆文本频率基本原理,针对传统文本表示方法中存在特征维度高与未考虑上下文语义关系的问题,提出一种word2vec结合词频逆文本频率的文本表示方法,与单独的word2vec或词频逆文本频率对比具有更强的特征提取和表示能力,并实现特征降维。然后,针对传统的情感分类模型中存在分类准确率较低的问题,提出一种基于长短期记忆网络的双通道字词特征融合的微博评论情感分类模型。该模型使用词频逆文本频率加权的词向量和字向量作为双通道特征输入给双向长短期记忆网络进行学习,并将特征融合结果输入长短期记忆网络进一步学习,最后通过全连接层输出情感分类结果。通过实验验证,该模型相比于其他模型在微博评论分类中具有更高的分类评分。最后,基于该分类模型设计微博评论情感分类软件。该软件通过网络爬虫获取微博的文字和图片评论,并输入提出的基于长短期记忆网络双通道字词特征融合的微博评论情感分类模型进行分类,逐条判定评论是正面评论或负面评论,并统计得到情感分类占比,同时根据分词结果统计词频,绘制词云。
其他文献
为研究不同秸秆还田量替代部分化肥后对黄土高原冬小麦产量、水肥利用效率和硝态氮积累特征的影响。于2018—2021年在晋南黄土旱塬冬小麦种植区,设置秸秆不还田(S0)、秸秆半量还田(S1/2)、秸秆全量还田(S1)、秸秆2倍量还田(S2)4个还田量处理,研究不同秸秆还田量替代化肥对冬小麦产量形成、水肥利用效率及土壤硝态氮残留的影响。结果表明:在黄土旱塬麦区,秸秆还田替代8.3%~31.9%N和15.
关键链技术是一种项目进度管理的新方法,近年来国内外学者对关键链技术的研究逐渐增多。对于关键链技术的研究主要集中在解决缓冲区设置不合理带来的项目间工序松弛、工期延误等问题,本文基于信息熵理论,建立了可以综合考虑整体复杂熵、单一复杂熵、施工难度熵、资源约束熵、决策者偏好因素的新的缓冲区设置模型,并结合根方差法改进了缓冲区计算公式,然后将冗余缓冲整合到项目缓冲之中,通过吸收可能出现的风险来对缓冲区设置模
电能路由器的直流母线是多种新能源、储能装置及各直流用电设备的桥梁,是新能源并网发电的中枢环节,研究直流母线电压及其功率控制对电能路由器稳定运行、提高新能源转换效率具有重要意义。本文针对分布式、储量大、转换技术相对成熟的风能接入电能路由器情况下直流母线电压稳定控制问题开展研究。重点研究了利用蓄电池与超级电容器储能特性的差异性,实现由蓄电池和超级电容器组成的混合储能系统(hybrid energy s
汽车的普及推动社会经济和现代文明高速发展,同时也带来了严峻的能源安全和环境污染等问题,节能和环保成为汽车技术发展的主题,政府的政策补贴和各大汽车厂商共同推动了电动汽车的发展。双向车载充电机作为电动汽车电池充放电的设备,它的能量变换主要通过双向DC/DC变换器实现,充电时应根据电池充电特性提供宽范围的电压,放电时在变化的电池电压下仍可提供稳定的功率。基于此,设计一种可以应用于车载充电机的隔离型双向变
随着科学技术的持续进步和经济社会的不断发展,人类对能源资源的需求迅速增长,由此造成的能源枯竭和环境恶化的问题日益严峻,已经严重威胁到了人类自身的生存和发展。因此,有必要开展热电联合系统经济环境调度相关的研究。本文的主要内容如下:首先,介绍了多目标优化问题和多目标优化算法的相关概念,阐明了基于帕累托支配的多目标优化算法的框架和多目标细菌群体趋药性算法的基本原理、具体流程,并分析了多目标细菌群体趋药性
在宏观经济运行背景下,随着市场环境的不断变化,企业经营活动面临的风险也日趋复杂。能否以现有的物质条件与技术支持为基础,对自身经营活动存在的潜在风险进行有效管控,成为企业管理者较为关注的问题。
配电网状态估计是配电管理系统的重要组成部分,其估计精度和运行速度对于配电网的电力调度和安全事故分析等功能有着极为重要的影响。动态状态估计不仅能够准确估计配电网的运行状态,还能够预知系统未来时刻的状态,这种先验信息有利于调度人员提前安排调度计划和进行系统事故分析。因此,动态状态估计的研究具有很好的实用价值。随着配电网的不断发展,其复杂的网络结构导致传统的集中式状态估计出现了一些问题,难以满足调度中心
行为识别(Action Recognition)是视频处理领域中的重要组成部分,它通过在时间域上预分割的序列来确定行为动作的类型。伴随着硬件设备的不断升级和视频采集设备的不断发展,行为识别技术的得到了越来越广泛的应用。该文针对卷积神经网络的视频行为识别算法进行了详细研究,通过设计并添加新的网络结构,旨在提高网络的特征提取和特征表达能力。具体工作内容如下:首先,构建了基于时空卷积优化的行为识别算法。
电力电子变压器是一种新型电力变压器,其结合了电力电子元件和高频变压器,不仅能实现传统电力变压器的功能,同时还可以控制功率双向流动,提高电能质量,抑制谐波等,从而具备了解决当代电力系统所面临的很多新问题的能力。当电力电子变压器不稳定时,电力系统的稳定性也会受到影响。为了检验电力电子变压器的稳定性,本文提出了一种基于Middlebrook判据的稳定性分析方法。本文研究内容主要包括:首先详细分析了单相P
能源需求与日俱增,分布式光伏电源(distributed photovoltaic,DPV)的推广应用成为解决能源危机的重要方案,但是DPV出力的随机性和并网设备的固有特性导致其缺乏惯量支撑。虚拟同步发电机(Virtual Synchronous Generator,VSG)控制策略的设计考虑提升DPV并网运行稳定性,为更好地提高VSG暂态功角稳定性,本文利用VSG控制参数灵活可调的特点,提出一种