论文部分内容阅读
“互联网+”时代,企业或商家热衷于利用基于互联网的社交平台收集消费者对自己所提供商品或服务的评价,用以提升产品或服务质量;基于商品评论的自动情感分析是实现其价值提升的重要手段。本文针对商品评论句子级情感分析和方面级情感分析展开了深入研究,其中主要贡献包括:针对基于Attention机制的句子级情感分类算法存在的固定编码问题,本文提出一种基于层级LSTM(Long Short Term Memory)和动态路由机制的句子级情感分类模型(Long Short Term Memory and Dynamic Routing Mechanism,LSTM-DRM),即在第一层LSTM利用Attention机制来提取重要的词语特征;在第二层LSTM利用动态路由机制动态地转移特征信息到分类层中。实验结果表明,与单一的Attention机制相比,本文提出的LSTM-DRM模型针对IMDB,Yelp2013,Yelp2014三个标准数据集可以获得更高的分类准确率和更低的均方根误差,验证了动态路由机制在文本句子级情感分类任务中的有效性。现有的情感分类算法忽略了商品评论数据集中用户和商品信息在情感分类中的重要性。本文在句子级情感分类模型的基础上,提出了融合用户特征和商品特征的LSTM-UPDRM(Long Short Term Memory and Dynamic Routing Mechanism Embeded User feature and Product feature)模型,即利用两个独立的LSTM-DRM模型分别嵌入用户和商品特征。首先利用Attention机制提取用户和商品在评论中显性的特定词;然后在分类层使用动态路由机制提取用户和商品在评论中隐含的情感特征;最后使用加权损失函数的方法表征两种特征对情感类别的重要程度,并在京东商品评论数据集中测试模型的准确率。对比实验结果表明:本文的LSTMUPDRM模型用于商品评论的句子级情感分类任务时可以取得93.4%的准确率,高于现有其他方法。针对目前方面级情感分类算法未考虑方面词语境信息的问题,本文提出并实现了一种融合语境词向量的动态路由模型(Embedding from Language Models and Dynamic Routing Mechanism,ELMo-DRM)来完成商品评论方面级情感分类。首先,利用ELMo模型得到语境词向量,然后,通过方面词编码算法将方面词特征结合到文本特征中;最后,利用动态路由机制聚合相似度更高的特征信息完成方面级情感分类。对比实验结果表明:本文提出的ELMo-DRM模型在商品评论方面级情感分类任务中可以取得90.2%的优于现有方案的准确率。