论文部分内容阅读
随着电子商务的快速发展,越来越多的消费者在互联网平台上发表了数以万计的产品评论。方面级别评论情感分析的主要目的即根据这些评论给出一系列简明的表达,说明消费者群体对于某一产品的各个方面的喜好程度。传统的情感分析方法虽然在文档级别的分析上取得了一定成果,但是随着情感分析的粒度细化到方面级别,这些方法的有效性均大大下降。方面级别的情感分析包括方面分类和情感分类两部分。从情感分类的角度看,分析方法应具有对高维向量输入进行有效分割的能力;从方面分类的角度看,分析方法应具有多分类能力。深度学习算法作为一种新兴的机器学习方法满足高维向量分析和多分类的需求。因此本文以深度学习算法为基础完成方面级别评论情感分析任务。 首先,本文根据深度神经网络的结构和情感分析的特点提出了从评论文本到神经网络输入转化的预处理框架,以及深度神经网络内部节点配置的选定算法。其次,本文根据自然语言处理的相关知识抽取三类文本特征构成特征向量,然后提出分级深度网络以综合使用各特征向量进行文档级别情感分析,该过程有效地进行降维并增加分析的准确度。最后,本文根据细粒度分析的需求提出子网络可复用分级深度网络,同步进行方面分类和情感分类以完成方面级别情感分析。 本文在电影、酒店和数码产品三个不同领域进行了对比试验。使用深度网络作为分类器的情感分析算法可以达到85%~90%的准确度,尤其在输入向量维数和输入数据量较大时准确度明显优于使用其他分类器。使用子网络可复用分级深度网络进行方面级别情感分析,方面分类的Rand Index达到0.9以上,而情感分类的准确度在85%以上,均优于近年来的典型算法(包括基于有监督学习和基于主题模型的算法)。