论文部分内容阅读
互联网技术的不断发展促进了电子商务发展,网络购物与人们的生活越来越密切,这种情况下便产生了大量针对各种商品和服务的用户评论数据,这些评论对用户和商家来讲都具有很重要的利用价值。但是互联网信息变化很大很快,网络上用户评论信息数据量很大,同时也具有很强的随意性,这导致大量的信息中有很多垃圾信息。如果通过人工的方式去处理会耗费大量的人力物力成本,效果也不理想。因此需要计算机来帮助用户和商家获取信息并进行分析,文本情感分析技术则能够很好的处理这项任务。本文以文本情感分析技术理论为指导,通过对产品评论的情感分析方法进行研究,设计出一套用户评论情感分析系统,该系统能够根据用户的需求自动的获取网上的信息,并对网上的垃圾信息进行过滤,然后使用情感分析技术对这些评论数据进行分析处理,自动的识别出用户对相关产品以及产品属性的喜好程度,归纳出商品的正负向评论信息以及涉及到的产品属性。最终通过可视化技术将结果展示给用户和企业。主要研究内容如下:(1)在双向传播算法的基础上提出一种基于规则和基于统计相结合的产品属性和用户观点抽取方法。根据中文语言词语的特殊性,将中文语言中的依存句法关系这种规则与双向传播这种基于统计的算法结合起来,从而能够提高抽取产品属性和用户观点词的准确率,然后通过点互信息法对抽取信息进行过滤,将冗余信息去除掉,最后形成产品属性和用户观点词的对应关系;(2)设计一个改进的词典法,将机器学习中的支持向量机算法引入。首先手工制作出一套情感词典,使用词典法对整个文本的情感值进行计算,这一步对整个文本进行初步的筛选,然后利用支持向量机对文本进行分类处理,经过实验分析将支持向量机引入情感极性识别中效果比较好。(3)设计出一套可视化展示方案,将文本情感分析的结果通过信息可视化的方式展示出来,根据不同的结果选择不同的图形进行展示。并对效果进行评估调查。(4)最后对整个系统的效果进行评测,并结合可视化设计的效果进行用户体验方面的满意度调查,制作调查问卷,通过对调查问卷数据进行分析总结。