基于文本情感分析技术的用户评论分析系统设计与实现

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:jly1211
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网技术的不断发展促进了电子商务发展,网络购物与人们的生活越来越密切,这种情况下便产生了大量针对各种商品和服务的用户评论数据,这些评论对用户和商家来讲都具有很重要的利用价值。但是互联网信息变化很大很快,网络上用户评论信息数据量很大,同时也具有很强的随意性,这导致大量的信息中有很多垃圾信息。如果通过人工的方式去处理会耗费大量的人力物力成本,效果也不理想。因此需要计算机来帮助用户和商家获取信息并进行分析,文本情感分析技术则能够很好的处理这项任务。本文以文本情感分析技术理论为指导,通过对产品评论的情感分析方法进行研究,设计出一套用户评论情感分析系统,该系统能够根据用户的需求自动的获取网上的信息,并对网上的垃圾信息进行过滤,然后使用情感分析技术对这些评论数据进行分析处理,自动的识别出用户对相关产品以及产品属性的喜好程度,归纳出商品的正负向评论信息以及涉及到的产品属性。最终通过可视化技术将结果展示给用户和企业。主要研究内容如下:(1)在双向传播算法的基础上提出一种基于规则和基于统计相结合的产品属性和用户观点抽取方法。根据中文语言词语的特殊性,将中文语言中的依存句法关系这种规则与双向传播这种基于统计的算法结合起来,从而能够提高抽取产品属性和用户观点词的准确率,然后通过点互信息法对抽取信息进行过滤,将冗余信息去除掉,最后形成产品属性和用户观点词的对应关系;(2)设计一个改进的词典法,将机器学习中的支持向量机算法引入。首先手工制作出一套情感词典,使用词典法对整个文本的情感值进行计算,这一步对整个文本进行初步的筛选,然后利用支持向量机对文本进行分类处理,经过实验分析将支持向量机引入情感极性识别中效果比较好。(3)设计出一套可视化展示方案,将文本情感分析的结果通过信息可视化的方式展示出来,根据不同的结果选择不同的图形进行展示。并对效果进行评估调查。(4)最后对整个系统的效果进行评测,并结合可视化设计的效果进行用户体验方面的满意度调查,制作调查问卷,通过对调查问卷数据进行分析总结。
其他文献
目的探讨弥散张量成像纤维束显像(DTI-Tractography)引导下结合术中神经核团定位技术对成人型脑干胶质瘤手术治疗的作用,并进一步总结该病的治疗策略。方法回顾性分析2010~201
18世纪末爱丁堡大学的泰特勒教授在《论翻译的原理》中系统地提出了翻译三原则。他认为优秀的译文应完全传达出原文的优点,原译文中的优点要易于为读者理解并使得两种语言的
目的研究MAT2A(甲硫氨酸腺苷转移酶2A)和NDRG2(N-Myc下游调节基因-2)基因在结直肠癌组织中的表达及两者的相关性,为结直肠癌的研究及治疗提供重要参考。方法选取68例术中切除
看历史《为什么苏州是历史上产生状元最多的城市?》隋唐到北宋时期,由于政治中心在西安、洛阳、开封一线,也就是在黄河沿岸,北方的状元就更多,而随着宋朝南迁,从南宋开始,南
结合新奥法施工理念,详细介绍了付罗坡二号隧道"三台阶七步开挖法"大断面段开挖方法、爆破设计参数优化和洞室变形监控控制技术。
<正>信息产业电子第十一设计研究院科技工程股份有限公司(以下简称"十一科技")是从事电子高科技的企业,如何在"一带一路"建设中占领一席之地是我们面临的挑战。要积极投身"一
今年全国两会期间,习近平总书记参加了政协联组会并发表了重要讲话,讲话内容主要包括公有制经济与非公有制经济的关系,政策的制定与实施的内在关系,非公有制经济健康与非公有
60万m3原油商业储备库是国家“十一五”重点工程“独山子1000万t/a炼油及120万t/a乙烯技术改造工程”的首座现代化原油储备库。工程总投资3.4亿元,该项目工程量大,工期紧,为了安全
微博是当今非常流行的社交和信息传播平台。2016年,随着里约奥运会与王宝强离婚事件的传播,微博彰显了作为一个信息传播平台的重要地位。在2016年9月,微博月活跃用户达到2.97
高校内部缺乏行之有效的创业体验学习已经成为阻碍创业教育发展的重要原因。创业过程中,学生追求一种未明确定义和不可控的路径,该过程充满了模糊性和不确定性,学生只有持续