【摘 要】
:
随着移动互联网的迅猛发展,社交网络平台充斥着大量带有情绪色彩的文本数据,对此类文本中的情绪进行挖掘不仅有助于了解网民的态度和情感,而且对科研机构和政府掌握社会的情绪变化及走向有着重要作用。传统的情感分析采用二分类方法,无法精确、多维度地描述出文本的情感,并且不同领域文本数据集中还存在细粒度情感标签缺乏的问题,为了解决以上两个问题,本文重点研究基于深度学习的可迁移细粒度情感分析方法,主要工作包括以下
论文部分内容阅读
随着移动互联网的迅猛发展,社交网络平台充斥着大量带有情绪色彩的文本数据,对此类文本中的情绪进行挖掘不仅有助于了解网民的态度和情感,而且对科研机构和政府掌握社会的情绪变化及走向有着重要作用。传统的情感分析采用二分类方法,无法精确、多维度地描述出文本的情感,并且不同领域文本数据集中还存在细粒度情感标签缺乏的问题,为了解决以上两个问题,本文重点研究基于深度学习的可迁移细粒度情感分析方法,主要工作包括以下几个方面:1.利用网络爬虫技术,针对微博平台的特点设计了相应的爬取策略,基于Scrapy爬虫框架,通过关键词筛选对微博平台中相关博文进行爬取,构成了新冠疫情期间观点数据集。2.提出了一种基于多通道卷积神经网络的细粒度情感分析模型BAMC。该模型由多通道CNN模型、LSTM模型和多头注意力机制模块组成,具体步骤包括:1)构建了三种向量表示,分别为单词向量、表情符号向量以及细粒度情感标签向量,将这三种向量输入到多通道卷积神经网络中以提取情感特征;2)经过LSTM提取文本中序列的特征,再由多头注意力对全文的整体特征进行捕捉;3)经过参数调优确定模型中各个超参数的最优值,再通过对照实验对本模型的有效性进行验证。3.提出一个可迁移的细粒度情感分析模型FMRo-BLA。该模型通过将预训练模型Ro BERTa中提取出的浅层和深层特征进行融合,将FGM对抗学习应用于特定领域文本进行细粒度情感分类任务,将源领域知识迁移到目标领域中,以解决数据集缺乏、数据分布不平衡的问题。之后通过消融实验验证各策略和模块对模型的影响。最后将模型运用在源通用领域和新冠疫情相关的目标领域数据集与其他先进模型进行对比,验证了本文提出模型的有效性。4.设计并实现了基于RESTful API的细粒度情感分析服务。首先通过将前述提出的模型进行封装,其次基于Flask框架结合Vue.js框架和Echarts技术搭建了细粒度情感分析服务的Web系统。最后实现了细粒度情感分析时间和空间维度的可视化展示。
其他文献
随着我国城市化进程的快速推进,城市交通压力逐年攀升,高效准时、安全舒适、节能降噪的城市轨道交通系统已成为城市交通的主力军。其中投资较少、建设周期短、环境适应性强的新型城市轨道交通制式,亦成为解决中小型城市交通压力的最佳选择。电子导向胶轮系统作为新型城市轨道交通系统,在先进的虚拟轨道跟随控制技术支持下,具有优异的通过性和转向性,发展前景不容小觑。全轴转向技术能有效地改善车辆的轨迹跟随性能。本文以降低
高速铁路安全工作信息化、数字化、智能化是现代铁路安全的重点研究方向。传统的动车组故障应急处置方案从设计到演练与验证主要存在三个方面的不足:一是缺乏方案演练与验证环境;二是方案演练与验证成本较高;三是方案演练与验证中反复操作设备,减少设备使用寿命,存在安全隐患。虚拟仿真技术凭借经济性和安全性的特点在现代铁路安全运维领域信息化、数字化、智能化中有着广泛应用场景。由于动车组故障应急处置方案流程间存在操作
2021年3月国家发布《国家综合立体交通网规划纲要》,要求建立“6轴7廊8通道”的立体交通网络。高速铁路客运系统作为国家交通网络的主要骨架,其可靠性和安全性越来越受到重视,而客运网络的安全性不是由单一的站点或者线路构成,而是由各种因素共同作用产生的。无论是单一地对客运网络进行网络分析,还是针对各个因素进行安全性讨论,都割裂了高速铁路客运系统的整体性。开展以站点特性为基础,以路网特性为架构的高速铁路
悬索桥因其跨越能力强,承载效率高,线形优美,成为大跨度桥梁的重要桥型。锚碇作为悬索桥的关键承载结构,其抗滑稳定性对整座悬索桥的安全性至关重要。齿坎式重力锚碇由于其抗滑稳定性好、锚碇体积相对平底锚碇较小,因而在实践中应用较多。但是目前对其承载机理和抗滑稳定性缺乏深入研究,并且缺乏合理的设计计算理论。本文依托某大跨悬索桥齿坎式重力锚碇,采用理论分析及数值模拟的方法,对其稳定性和承载行为进行分析。主要研
植物的生殖成功一直是植物生殖生态学研究的一个重点。为了探讨星叶草种群大小与密度对其生殖成功的影响,在王朗国家级自然保护区,于2010年和2011年分别调查了34和35个种群的种群大小、种群密度、种群内平均个体大小(指标为株高、叶数和花数)和平均个体生殖成功(指标为种子数和结籽率),运用Pearson相关分析了种群大小与密度对植物平均个体大小及平均个体生殖成功的影响。另外,在2010年,以种群密度和
随着我国经济的发展与进步,多火源火灾发生频率近年来明显增加。多火源火灾又称群发性火灾,指非连续分布的两个或多个相邻的火源同时发生燃烧的火灾,是一种离散的、非连续性的可燃物燃烧现象,常见的多火源火灾发生地为森林、木制古建筑群、地下空间等具有相邻且离散的可燃物地区。多火源火灾的燃烧强度大,对建筑设施和建筑结构的破坏远高于单火燃烧,大大增加了消防救援难度,严重威胁人们的生命与财产安全。因此,研究多火源火
在跨越山区峡谷等障碍物时,大跨度斜拉桥、悬索桥是重要的选择方案,其对风荷载较为敏感,建设场地的强风特性是决定其风致响应的关键因素。与沿海及平原地区的风场相比,山区峡谷阵风强烈,湍流强度大,非平稳性突出,风场空间分布复杂。目前针对复杂桥址区平均风特性的研究较多,特别是通过CFD数值模拟的方法来研究其风速标准,而对湍流特性的研究涉及较少,因此本文针对复杂桥址区风场湍流特性CFD模拟研究中的关键技术开展
近年来,随着智能监控系统以及智能图像处理技术发展,行人重识别技术在智能安防领域的嫌犯追踪、大型公共场所的智能寻人、智慧商业的无人超市及智能机器人等领域有着广泛的应用前景。由于真实场景复杂多变,行人重识别在实际应用中仍面临诸多难点,主要表现在姿势、步态、服装等行人属性多变,及光照变化、摄像视角差异、物体遮挡等环境因素干扰严重,这些差异性导致提取人体的鲁棒特征表示极为困难。本文提出一种基于局部注意力机
随着我国铁路运输需求的日益提升,增加行车密度,缩短列车间隔已经成为国内铁路运输组织提高运量的一种有效途径。然而这必然导致有砟轨道养护任务负担加重和养护天窗期缩短,因此,提高维护效率刻不容缓。在列车间隔利用小型养路机械施工的养路方式已经不能满足目前的要求,运用高作业效率的大型养路机械就十分必要。轨道动力稳定车是有砟轨道维护作业中常用的大型养路设备,自1984年从国外引入到自主研制开发,我国在运用稳定
a-淀粉酶(a-1,4-葡聚糖-4-葡聚糖水解酶,EC3.2.1.1)催化水解淀粉,糖原和麦芽糖的a-D-(1,4)-糖苷键,随机地作用于淀粉的非还原端,生成麦芽糖,麦芽三糖,糊精等还原糖。该蛋白广泛分布于细菌,古细菌和真核生物中。由于其广谱的淀粉水解活性,不仅在食品工业中具有较高应用价值,而且在医疗、日用化工及饲料等方面也发挥着重要的作用。目前工业途径获得的a-淀粉酶主要是从微生物中提取,但在饲