融合表情符号的中文短文本情感分析研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:pxghq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社交平台等应用的飞速发展,海量的用户社交文本数据相继产生,为情感分析提供有利支撑,但有关情感分析的大部分研究仅聚焦于文本信息,忽略了表情符号的存在意义。在特定的场景下,表情符号往往比文本更容易凸显情感色彩。深度神经网络在情感分析等任务中发挥出色,但仍然存在一些挑战和问题。当文本被添加扰动或恶意破坏时,深度神经网络会因鲁棒性差而导致分类结果误判。本文针对上述问题开展研究,主要工作如下:(1)构建了包含大量表情符号的数据集。由于难以找到开源的并且含有大量表情符号的数据集。本文结合微博评论数量庞大、文本长度短等特点,收集整理了大量包含表情符号的评论,通过人工筛选后标注情感类别,为后续研究工作提供数据支持。(2)提出了一种基于表情符号的Skip-Gram模型和负采样方法,对表情符号向量进行嵌入。通过实验证明了表情符号嵌入算法的有效性,为含有表情符号的微博文本的情感分析提供了有力的支持。(3)提出了结合自注意力机制的双向门控循环单元网络(SA-Bi GRU)情感分析模型。自注意力机制能够计算词语间、表情符号间和词语与表情符号间的依存关系,双向门控循环单元网络,能同时捕获前向和后向的语义依赖关系。实验结果表明,将自注意力机制和双向门控循环单元网络进行结合,能有效提升情感分类的性能。(4)针对深度学习网络鲁棒性差的问题,并且为了进一步提升分类模型性能,本文对现有的基于同义词替换算法的对抗攻击方法进行改进,同时,结合微博文本特点,提出一种融合表情符号的文本对抗样本生成算法。在此基础上,将该方法引入对抗训练中,进一步提高了模型的鲁棒性和分类效果。
其他文献
航空航天技术的飞速发展对航空发动机零件的质量要求愈发强烈,航空发动机零件主要通过锻造的方式来制备,其中锻件的变形均匀性很大程度上影响到零件的各种性能,而影响锻件变形均匀性的因素有很多,其中预锻件形状的不同对之起关键性作用,然而,预锻件的形状若以传统的试错法、经验法等其它方法来设计,将会十分耗时、枯燥,且对工程师的能力有较大要求,因此,论文主要基于控制航空发动机盘类锻件的变形均匀性,提出了两种预锻件
精密转台是实现物体精准空间定位的光机电一体化设备,广泛应用于各类精密加工检测系统。在精密加工检测系统中,精密转台是必不可少的设备,其性能直接影响加工检测质量。精密气浮转台是一类采用气浮轴承的精密转台。精密气浮转台的定位精度和跟踪精度易受非线性摩擦、转子微振动、电机谐波转矩等扰动的影响。精密气浮转台的运动精度限制了它在精密加工检测系统中的进一步应用。因此,研究精密气浮转台控制系统,提高转台运动精度具
低空小型无人机给各行各业带来便利的同时,也导致“黑飞”事件频发,对交通秩序、公民的人身和隐私安全等造成了威胁,以防范“黑飞”为首要问题的低空安防成为了社会热点问题。因此,开发实时侦测预警低空无人机活动的智能化系统成为净化城市低空环境、维护低空安全的关键。由于闹市区人口密集、建筑物庞大、电磁环境复杂,且低空无人机具有飞行高度极低、速度慢、噪声大等特征,对低空无人机侦测预警技术提出了适应复杂地理建筑环
在早晚温差大的地区,室外电气设备内部容易发生凝露现象,凝露易造成爬电现象,引发设备故障,对电力系统安全稳定运行带来隐患。本文利用大气压低温等离子体射流技术,对环氧树脂和硅橡胶两种绝缘材料进行表面憎水改性,从实际工程应用角度出发,确定了一套最佳憎水改性气体流量参数,并探究了经等离子体在绝缘材料样品表面沉积憎水薄膜后,其表面物理化学特性、电学性能的变化。首先设计搭建了一套等离子体射流喷涂装置,采用高频
随着负荷的不断增长与新能源的大规模接入,电网运行的安全域不断减小。为实现资源的优化配置,需充分挖掘电网的运行弹性空间,扩大电网运行安全域。汛限水位的动态控制赋予了水电库容弹性空间,库容弹性的利用将有利于提升水库调蓄能力,扩展水电调度优化可行域。为探究库容弹性对电网运行效益的影响,本文在电网调度中计及库容弹性,实现水力、电力协调优化调度。同时,机组启停整数变量及调度决策约束的时段耦合特性,导致计及库
铝是世界上应用最为广泛的金属之一,Hall-Héroult法是工业大规模电解制铝的重要途径。为了降低电解过程的能耗和提升工艺效率,通常加入NaF-AlF3熔融盐到电解质中以降低Al2O3的熔点和增强体系的电导率。NaF-AlF3熔融盐的微观结构、组成及其对电解过程的影响是该工艺中重点关注的基础性问题,而NaF-AlF3熔融盐的研究受强腐蚀性、强挥发性和高温环境等试验条件的限制,通常需采用高温拉曼光
为提高化石能源的转化效率,降低能源转化过程中的污染物排放,燃烧过程的有效调控成为了国内外学者研究的重中之重。燃料重整技术能根据不同工况的特点来调整燃料的品质,被视为是实现清洁燃烧、提高燃料效率的最有效的手段之一。然而,当前常用的重整技术普遍存在着重整产物单一、过于依赖贵金属催化剂等问题,大大制约了燃料重整技术的推广应用。在该背景下,本文提出并设计了一种基于冷焰燃烧动力学的新型无催化燃料低温重整方法
长江上游控制河段航道通行条件差,船舶必须根据通行信号单向、有序通行,而通行信号依据航道内的AIS(Automatic identification System,船舶自动识别系统)数据解码获得船舶信息,根据控制河段的通行规则产生。虽然AIS数据中包含了船舶速度、位置等信息,但没有提供在指挥过程中至关重要的船舶上下水和船舶所在控制河段具体位置的信息,同时由于控制河段沿岸环境复杂,导致AIS信号接收范
铸造业是国民经济的重要产业。可是,铸造业在创造巨大经济财富的同时,也消耗了大量资源,并对环境造成了严重影响。因此,实施绿色制造工程,进行工艺绿色化改造已成为铸造业可持续发展的关键战略。但从目前的总体情况来看,仍缺乏能有效识别工艺过程节能减排关键环节和关键影响因素的有效手段,同时,企业普遍存在生产系统中信息流断层的现象,这已成为制约工艺绿色化改造和绿色制造工程深入实施的瓶颈,阻碍了铸造业的可持续发展
近年来,随着渠段控制算法在调水工程中的成功应用,多渠段系统运行调度水平大大提高,国内水资源分配不均问题得到了极大的解决。在调水工程中,渠系自动化是至关重要的一部分,要求渠系内输水装置能够实现自动化控制,控制的精度和效果的及时性都直接影响到调水工程的输水效果。当前的渠系结构多为串联结构,由于系统结构的特殊性,致使多渠段系统是一个滞后性大、高度非线性、耦合性强的控制系统,且难以得到精准的数学模型,这使