论文部分内容阅读
随着网络购物市场的快速发展以及相关购物平台与应用的多样性与便捷性,网上购物给人们的生活带来极大的便利,越来越多的人开始接受与选择这种生活方式。但由于网络商品的虚拟性和不可触摸性,人们无法提前感知欲购产品的质量,于是很多人都倾向于依赖商品的在线评论而做出购买决定。该情形又滋生了一些无良商家通过"好评返现"等各种手段制造出大量商品评论,这不但增加了消费者筛选评论的时间成本,也可能会造成不必要的经济损失。因此,如何快速地识别高质量的在线评论成为当前在线评论内容研究的新课题。本研究从在线评论内容出发,首先提取影响在线评论质量的特征指标,然后构建在线评论质量评价指标体系与模型,最后验证模型性能。具体内容包括如下五个部分:(1)评论文本的有效性标注。通过改进基于长度的自动标注算法和K-means算法,提出Lk-means算法对评论文本进行有效性标注,提取有效性这一指标;(2)指标提取。将在线评论数据分为数值型和文本型两类,二者结合可获得完整性指标;并从数值型评论中提取评分数据,从文本型评论中提取信息量、可读性、主题相关度和一致性这四个指标。(3)构建在线评论质量评价指标体系。根据改进信息质量评价的WRC指标和研究中发现的数据质量评价的1R3C指标,提出本研究的1W2R3C评价指标体系:(4)建立在线评论质量评价模型。首先根据获得的评价指标建立在线评论质量评价模型,然后将评论数据分为训练集和测试集,并利用训练集获得模型中的各评价指标权重和利用测试集验证模型性能。(5)模型性能验证。对模型的性能验证将从两方面进行:一是利用本文提出的1W2R3C指标体系,和WRC与1R3C指标,分别建模进行对比分析;二是基于本文模型训练的指标权重,引入专家打分法和灰色关联度修正法分别获得指标权重,然后进行建模对比分析,由此充分验证模型的优良性能。本文关于在线评论质量评价模型的研究结果,可为深入研究在线评论内容提供一些新的方法和理论依据;用于实践后也可为广大消费者提供相应的决策支持。