在线商品评论情感分析和评论有用性的研究

来源 :广西民族大学 | 被引量 : 1次 | 上传用户:liongliong496
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的发展,网络购物已经成为人们的习惯。大量的评论数据出现在各类网站上,在这些评论数据中隐藏着很多有价值的信息。我们对评论数据进行细粒度情感分析,发掘用户对产品的情感倾向,发现商品优缺点,为提升产品质量提供有力的数据支持;我们还可以对评论数据进行有用性分析,让顾客可以在大量的评论中发现有用的评论,进而快速地完成购物决策的达成,节省翻看评论的时间。在商品评论情感分析的研究中采用了种不同的方式,一种是基于情感词典方式;另一种是基于机器学习的方式。主要研究工作如下:1.研究了基于词典情感分析,基于机器学习情感分析,评论有用性相关文献综述,对比了前人研究中的优缺点。2.构建一个比较完备的基础情感词典,网络用语词典,否定词词典。对不同情感强度的情感副词建立情感强度副词词典,并将情感强度副词分为5个等级。采用改进后的SO_PMI模型计算评论的情感倾向,分别从情感值,情感平均值,情感标准差值对评论进行分析,完成基于词典的情感分析。3.基于机器学习进行情感分析,首先标注了正向,负向情感倾向数据各1000条,然后分别采用一元文法,二元文法,一元+二元文法对常用的三种机器学习方法(贝叶斯,支持向量机,逻辑回归)进行实验比较,分析了不同贝叶斯决策对分类的准确性,分析了不同支持向量机核函数对分类的准确性,确定最佳特征工程,选择合适的词向量维度,确定最佳分类器。结论是多项式贝叶斯分类器准确率达到93.0.%。4.商品评论有用性分析使用word2vec神经网络模型建立商品属性词典。建立一个评论有用模型(PA_SO_PMI),通过评论有用性值,有用性平均值,有用性方差值来对评论的有用性进行分析,通过有用性方差值排序得到最有用评论。
其他文献
<正>1当前电视体育报道现状及脱颖而出的《天下足球》体育节目是电视传播中一类形式较为特殊的节目形态。由于体育运动带有很强的竞技性,从而使体育节目在反映和表现内容方面
在铸件充型凝固数值模拟系统中,前处理模块为所有后续模块提供计算所必须的网格信息,是进行数值分析的前提与基础,其性能的好坏直接影响到整个系统的实用性及计算的准确性。后处
本文介绍工业机器人在打磨和抛光等行业中的应用分析,介绍EFORT机器人自动打磨抛光系统的设计思路和控制原理,介绍硬件配置和软件控制设计思想及打磨刀具磨损补偿等。
<正>职业性肌肉骨骼疾患(work-related musculoskeletal disorders,简称WRMDs)或职业性肌肉骨骼损伤(occupational musculos-ketel injury,OMSI)是指从事生产劳动或其他工作
会议
大块非晶合金是一类具有强的非晶形成能力的合金。其微观机理目前还不清楚。本文借助Miedema半经验模型,考察了组元间负的混合热以及弹性应变能与非晶形成能力间的关系,发现一
本文首先论述了计算机控制非球面抛光的基本原理—Preston方程,对影响计算机数控抛光表面误差收敛速度的主要因素—磨头工作函数进行了详细的讨论。提出了以趋近因子作为评价
教育信息化2.0时代,面向数据密集型教育新范式,将教育转化为以教学和学习理论为支撑、大数据为基础、计算和模型为手段的科学成为教育领域新呼声。“数据”作为教育信息化2.0
<正>《一个人的战争》(以下简称《战争》)是林白的第一部长篇小说,自1994年在《花城》杂志首发以来,迄今已20多年了。这20多年间,《战争》先后有十多个不同的版本在海内外传
电视新闻访谈作为一种常见的新闻传播方式吸引了越来越多的电视观众,它已经成为人们不可或缺的信息来源。因此国内外学者掀起了对新闻访谈语言的研究浪潮。此类研究多集中于
齿轮作为应用量大面广的基础件产品,其质量直接影响我国相关机电产品的质量和在国际市场的竞争力。从总体水平上看,我国的齿轮在承载能力、使用寿命和噪音水平等技术指标与国外