基于多任务学习的端到端属性实体情感分析研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:ffcsyangchh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的普及,越来越多的人选择在线上进行消费、娱乐、社交以及学习,同时也在各类网络平台上留下了大量的评论文本。这些海量的互联网评论文本数据中蕴含着用户对不同事物的观点和情感信息,可以为不同人群制定决策提供参考。属性实体情感分析是一种文本挖掘方法,可以从评论文本中提取出细粒度的情感信息。属性实体情感分析中包含了三个子任务:属性词抽取(AE)、观点词抽取(OE)和属性情感分类(ASC)。现有的大多数研究只提供了AE或ASC其中一个子任务的解决方案,实际应用时虽然可以通过管道方法将模型组合起来,但这样的方式没有利用子任务之间的关联信息,而且存在错误传播。基于这个问题,本文主要研究了端到端的属性实体情感分析,利用多任务学习模型同时解决AE、OE和ASC三个子任务,针对任务中特征抽取和子任务交互的方式,提出了两个多任务学习的模型:(1)基于注意力的多任务学习的属性实体情感分析模型(AMN-ATSA)。模型中使用了多头注意力网络作为的特征抽取器,相较RNN网络有更强的特征抽取能力和并行计算能力。根据AE、OE、ASC三个子任务之间的联系,基于注意力机制设计了对应的交互方式,增强了子任务间信息交互的能力。在SemEval-2014和SemEval-2015数据集上的实验表明,AMN-ATSA模型表现要优于其它基准模型,并且其训练速度也远超基于RNN的基准模型。(2)基于语法增强的多任务学习的属性实体情感分析模型(SMN-ATSA)。针对多属性词情况下难以准确匹配属性词和对应观点词的问题,设计了基于语法增强的注意力交互机制。同时,模型中提出了增强的消息传递机制,通过传递信息维度更高的任务相关特征更新共享特征,使得子任务模块在迭代过程中获得更丰富的信息。实验结果表明,与各类端到端的基准模型相比,SMN-ATSA模型在所有数据集上端到端的指标均达到最优。同时还通过消融实验证明了模型中两个机制的有效性。
其他文献
有机气凝胶因其极小的密度和优异的隔热性能,在建筑装饰、交通运输和航空航天等领域具有广阔的应用前景。然而,大多数有机气凝胶主要由碳、氢元素构成,遇火极易燃烧,严重威胁人们的生命和财产安全。目前,主要依靠添加阻燃剂来提高有机气凝胶的阻燃性能。然而,阻燃有机气凝胶在使用过程中,特别是应用于高温隔热领域时,依然存在着闪燃和助长火灾蔓延的风险,无法满足日益提高的消防安全要求。因此,本论文将有机气凝胶与蒙脱土
随着我国“一带一路”合作倡议的逐步深化,我国在西非地区的道路援建项目也逐步增多,西非地区广泛分布着红土粒料等我国少见甚至没有的特殊筑路材料,红土粒料在矿物组成、力学性质等方面存在较大变异性,当地也没有通用的红土性能标准。研究针对西非区域内的多种红土粒料,进行了材料特性分析、力学性能分析、数值模拟试验、强度形成机理分析和工程应用推荐,旨在为道路设计和工程建设提供一定的参考。首先,对西非地区十几种天然
稻谷、小麦和玉米是中国的三大主粮,以其为原料制成的米面制品含有丰富的营养物质,但其在加工、储藏、销售的过程中均容易被食源性微生物污染。据调查,大肠杆菌(Escherichia coli O157,E.coli O157)、沙门氏菌(Salmonella)、金黄色葡萄球菌(金葡菌,Staphylococcus aureus,S.aureus)和乳酸片球菌(Pediococcus lactis,P.l
传统二烯类橡胶及其复合材料的高弹性和化学稳定性得益于硫磺交联形成的稳定立体交联网络,而该交联网络的不可逆性导致橡胶废弃制品不能得到有效的回收利用而导致环境污染问题,可见目前传统的橡胶交联技术已成为橡胶工业循环经济发展的瓶颈问题。目前基于可逆共价键的高分子网络得到了国内外众多研究者的高度关注,成为世界高分子科技的前沿研究热点。本文将开发多官能度氮氧自由基交联剂在二烯类橡胶及其复合材料中构建热可逆化学
现实场景很多数据具有复杂结构,如分子结构、数学公式、社交网络数据等。具有复杂结构的数据,其组成元素之间往往存在复杂关系。例如,数学公式中存在的上下标关系,化学分子中原子间的连接。然而,复杂结构关系与逻辑关系的识别与推断十分困难。近年来,深度学习在处理结构关系上展现出巨大的潜能。因此,本文基于深度学习分别研究复杂结构的识别和推断问题。针对复杂结构识别问题,本文对数学公式识别及化学结构识别两个具体任务
图书馆是人类知识的宝库,越来越多的人选择通过借阅图书来提升自己,但传统图书馆借阅服务消耗借阅者大量时间对图书查找与定位,给借阅者带来许多不便。因此本文提出一种先进行个性化图书推荐再对推荐图书导航的主动性服务的方法来优化图书馆借阅服务,帮助借阅者更快速找到满意的图书以提升借阅体验。协同过滤模型是个性化推荐算法常见的实现方式,但是对于稀疏的图书借阅数据,目前大部分协同过滤模型存在初期数据不足导致的推荐
能源转型和能源互联网背景下,新一代电力系统呈现出多能协同、负荷柔性可控、储能灵活调控和市场化运行的特征,海量信息和新兴业务不断涌现。配电物联网边缘计算终端资源有限,且承担了数据和业务的就地处理和优化控制等重要功能。因此本文着重研究边缘计算终端有限计算资源的前提下对配电业务计算负荷云边协同优化调度,以适配计算负荷与计算资源,提高系统的整体性能。本文首先面向监控业务研究可调度的微服务计算负荷建模方法,
柑橘渣是柑橘加工业的主要残留物,其特点是季节性生产和具有高含水量。由于经济和环境因素,柑橘渣的处置受到相当大的限制。然而柑橘渣本身营养价值丰富,含有纤维、单糖、有机酸和抗氧化物质等,是极具潜力的发酵基质。本课题筛选了可利用柑橘渣的发酵菌株,并初步探索了该优势菌株的基因功能;结合发酵常用的酵母菌,确定最佳菌种组合,探究了提高柑橘渣蛋白含量的最优发酵条件,构建柑橘渣高效共发酵体系;分析了发酵过程中微生
聚氯乙烯(PVC)广泛应用于建筑材料、工业制品、日用品、包装膜、纤维等众多日常生活领域。由于PVC使用量最多的增塑剂邻苯二甲酸酯类会对健康和环境造成危害,众多法律法规已限制其在食品、医药、玩具等领域的使用,人们迫切需要邻苯类增塑剂的绿色替代品。现有的绿色增塑剂如环氧大豆油和氯代脂肪酸甲酯等因结构中直链较多,分子链段的不饱和度高,相对分子质量较小,导致其在PVC中较易迁移。因此,本文主要以工业级氯代
纳米纤维素及其制备的纳米纸是替代石油基产品理想选择,在包装、电子器件、过滤材料等诸多领域具有潜在的应用价值。但纳米纤维素的亲水性较强且易燃烧,导致其制备的纳米纸阻燃性和耐水性能差,限制了在一些领域的应用。本文使用磷酸盐对纤维素纤维进行改性,再进行高压均质得到纳米纤维素,用真空抽滤的方法制的具有阻燃性能的纳米纸,最后使用金属离子和PAE(聚酰胺环氧氯丙烷)对纳米纸进行耐水改性。反应温度对磷酸化纤维素