论文部分内容阅读
商品评论数据情感分析一直是国内外的研究热点,通过对消费者的评论进行情感分析,推断出消费者的消费行为、消费动机和消费偏好等,从而为企业和商家制定商品的发展战略、提升商品和服务质量以及拉升新老用户的商品转换率。目前对于商品评论数据的情感分析研究虽然已经取得了较好的成果,但也因为评论数据格式的多样化、神经网络训练时间长等原因没有得到更好地发展。随着自然语言处理领域中的文本分类和情感分析技术的快速发展,研究者可以通过文本的句式关系、方面词的属性特征以及深度学习技术,从商品评论数据中更好地分类出商品的属性特征并设计出情感分析模型。本文以海外电商评论数据为研究对象,探讨评论数据的情感分析模型。首先基于改进的依存图结构和优化的注意力机制计算方式对评论数据进行方面词和情感属性词分类;然后再将方面词交流层和改进的位置注意力机制引入文本分类处理中,并结合LSTM记忆网络来提升模型的情感分析效果;最后设计并实现了基于web的海外电商评论数据情感分析原型系统。具体工作如下:(1)针对现有情感分析模型无法对方面词属性进行更好捕捉以及情感属性权重分配计算要求高的问题,提出一种新的情感分析模型DGBLE-LSTM。该模型对原有依存树结构进行改进,引入依存图结构进行方面词属性捕捉,并在原有注意力计算基础上,引入学习矩阵和平衡因子来进行情感权重分配。DGBLELSTM情感分析模型一方面解决了原有依存树结构对方面词属性捕捉不充分的问题,另一方面降低了注意力计算过程中对隐藏层表示和权重向量的维度和空间要求,并提升了情感分析效率。实验结果表明,对比依存树结构分类方法,DGBLE-LSTM在分类准确率上分别提升0.71%~1.175%;对比不同方式的LSTM情感分析和DASN情感分析模型,DGBLE-LSTM在情感分析准确率上分别提升6.2%~10.89%,充分说明DGBLE-LSTM在情感分析上具有较好的效果。(2)针对DGBLE-LSTM中方面词与属性词之间关系没有充分利用的问题,对原有的分类方法进一步优化,提出改进的情感分析模型DGABLE-LSTM。该模型在文本方面词处理上引入方面词交流层和改进的位置注意力,一方面让方面词自身情感属性融入到模型中,将其与文本进行交流互动;另一方面,利用文本距离远近对于属性词重要程度特征,引入位置注意力机制,并对其表达式进行改进,充分考虑到文本中没有方面词出现的现象,从而更好地捕捉方面词所对应的情感属性词。此外,将工作1中所提出的依存图结构和改进的注意力机制计算公式引入,并结合LSTM来保持文本的整体性和降低模型训练时长。实验结果表明,对比DGBLE-LSTM情感分析模型,DGABLE-LSTM在方面词分类和情感分析准确率上分别提升0.64%和0.69%,充分说明优化后的DGABLE-LSTM在情感分析上具有更好的效果。(3)在上述研究的基础上,本文完成了基于web的海外电商评论数据情感分析原型系统的设计与实现。