论文部分内容阅读
随着社会的发展,人们更多地把评价信息当作自己的商品选购的主要依据,而大量的评价信息也成为了人们关注的焦点。人们更多地把注意力集中在商品评论的信息上,通过分析评论文字对用户和平台都有很大的好处,并且有助于进行面向层面的情绪倾向性分析。方面级情感分析是情感分析中的一种细粒度的情感分析任务,在情感分析中,各层次的情感分析是一个非常重要的研究课题。研究的目标是从语篇的语义信息中,对一个实体进行多个属性层面的评价,也就是多层面的情感倾向。目的是通过学习文本的语义信息来判断评论文本中一个实体多个属性刻面,即多个方面的情感倾向性。本文深入分析现有基于注意力机制的方面级情感分类算法后发现存在如下问题,首先,现有的注意力机制对情感词和方面词的权重分配没有结合整个评论文本的语境。特别是,直接使用深度学习模型对全文进行分析,导致方面词和情感词的权重分配不均衡。其次,现有算法不仅缺乏先验知识的利用,而且情感词的多义现象也没有得到解决。针对上述问题,本文的主要研究内容如下:(1)针对方面词和情感词的提取,提出情感词典和多头注意力机制相结合的情感分析算法。首先依据句法依存关系对方面词及情感词进行实体及关系提取,获取两者的位置信息,同时扩充已有的传统情感词典,情感词涵盖在不同语境下所表示的情感倾向;其次通过多头注意力机制对方面词、情感词及上下文统一建模,计算方面词及情感词在上下文中的特征权重大小,形成特征矩阵;最后输入到卷积神经网络实现两者的交互,完成方面级情感倾向性分类任务。(2)为解决评价方面词和上下文的语义联合建模的问题,在研究过程中考虑到评价方面词和上下文文本之间有较强的相关性。提出交互注意力机制结合位置感知的方面级情感倾向性分析算法,交互注意力机制包含两个部分分别是全局注意力机制和局部注意力机制。全局注意力机制是提取整个文本的特征,局部注意力机制是结合给定的方面词类别,调整方面词在文本中的权重。利用位置感知方面词与情感词的相对位置信息,形成方面词与情感词的二元组。该算法结合上下文语境对情感词进行分类,实验结果证明交互注意力机制在AI Challenge 2018和网络评论数据集的结果,分别比次优模型的准确率增加0.79%和0.93%。