论文部分内容阅读
随着互联网的快速发展,微信、微博、社交网站等社会化媒体也得到了迅速发展,与此同时,产生了融合社会化媒体的电子商务,即社会化商务。在社会化商务环境中,以消费者为主要生产者的文本数据呈爆炸式增长,各大社会化商务平台中出现了大量的文本评论、商品推荐、商品购买分享等信息,这些信息统称为用户生成内容,即UGC(User Generated Content),主要指用户原创的内容,包括文本、图片、视频等内容。而用户生成内容中蕴藏着与商家信誉有关的各种因素,因此对用户生成内容中的文本数据进行萃取、挖掘,提取出与商家信誉有关的文本信息,将会有利于社会化商务的发展,还可以为消费者的购买决策提供有力支持。本文采用文本挖掘技术,对用户生成内容进行主题词抽取、主题词聚类和类簇标签抽取,进而生成商家的信誉维度和构建商家信誉评价指标体系,最后评价商家的信誉等级。主要包括以下两方面的内容:商家信誉维度抽取。提出了基于HNC和词汇链的短文本主题词抽取方法,在构建词汇链的过程中,把基于HNC的词语相似度和基于词共现模型的词语相关度相结合,提出了词语间的语义融合度的计算方法,并以候选主题词和词汇链的语义融合度值来衡量两者之间的语义关系。在词汇链构建完成后,把全部词汇链的综合权重进行计算,选择综合权重大于指定阀值的词汇链中的词语作为主题词。通过主题词聚类、类簇标签抽取和类簇标签人工归纳总结,得到相应的商家信誉维度。最后采用蘑菇街电商平台中的文本数据来进行实验和实例分析,证明了本文提出方法的可行性和优越性。商家信誉评价。根据生成的信誉维度构建商家信誉评价指标体系,通过引入云模型,提出了一种基于云模型的商家信誉综合评价方法。在评价过程中,运用云模型来构建信誉指标的综合评价矩阵,结合信誉指标的权重,得到商家信誉综合评价云模型。计算综合评价云模型与各个评语集云模型的相似度,相似度最大的评语集云模型对应的信誉等级就是商家的信誉等级,并将评价结果以云滴形式直观地展示。本文给出的商家信誉维度抽取方法和商家信誉等级评价方法,推动了相关科学研究的进一步发展,针对社会化商务中商家信誉评价所存在的问题进行了一定的改善,具有一定的实际意义和现实意义。