基于在线评论的个性化推荐研究

来源 :南京财经大学 | 被引量 : 4次 | 上传用户:jmfxuexi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
伴随着互联网时代的飞速前进,我们的周围充斥着信息量巨大的网络信息,而这些信息也在生活中扮演着日趋重要的角色。尤其是在电子商务领域,人们每天都要进行购物消费,产生了大量的产品信息和评论信息。如果能够从海量的文字信息中获取有价值的内容,就可以极大地提升消费者的购物体验,促进商品成交率。这非但是在学术领域,而且也在商业应用方面掀起了一股研究的热潮。推荐系统通过探索用户在过去发生的行为数据,以及这些行为和产品自身属性之间的相关性,实现模型的建立,达到用已发生的行为来预测未来行为的目的。简单地说,在实际应用中,就是通过推荐用户可能出现兴趣点的各类产品,来实现业务量的增长。以往的推荐系统主要将重心放在基于内容的推荐方法上,将其他产品和用户曾经购买或选择过的产品进行属性特征的对比,若相似程度较高则予以推荐。本文在此基础上,不仅考虑了产品本身的描述属性,又综合考虑了评分和评论等信息,提高了推荐的准确率。本文首先需要利用网络爬虫对产品信息进行采集,并将采集到的评论文本进行分词等预处理工作,经过预处理后的词语就构成了一个词典集合。由于特征词数量庞大,本文运用了改进的LDA主题模型进行特征提取,结合TF-IDF计算,综合选取不同粒度下的特征,挖掘主题信息,计算出文本在各个主题上的概率分布和权重。最后,本文结合用户兴趣模型,使用sigmoid函数,改善冷启动环境下产品相似度计算时从属性特征到评论特征的过渡,采用欧几里得距离公式对各文本之间的相似度进行计算,将相似度较高的产品作为推荐列表输出并进行推荐。本文将亚马逊中文网站上的图书信息作为实验数据进行实验分析,本文在实验的过程中还讨论了当主题数量发生变化时,对于文本在主题上的概率分布的影响。另外,本文对选取不同特征项以及采用不同特征提取方法的推荐性能指标进行了评价,主要包括准确率、召回率以及F-Measure指标。在对实验结果分别观察后可以看出,与传统的推荐方法相比较而言,本文选用的方法在考虑了评论文本信息并改进后,推荐效果更为准确。
其他文献
晚上十点多,师杰才抱着一摞书回到宿舍,这是她援藏一年的“常规操作”。同宿舍援友、护理部主任关玉霞说:“她下班以后经常很晚还在办公室看片子,据说这一年诊断的病例量比前
探讨了用咸蛋腌制剂加工咸蛋的不同方法以及腌制过程中几个重要理化指标的变化规律和黑蛋黄、黑蛋圈的发生情况。结果表明,咸蛋腌制剂适用于盐水浸泡法、泥包法和灰包法生产咸
首先阐述了超细颗粒的流化特性(初始流化速度、床膨胀等)及团聚流化过程,然后重点对近年来国内外在改善粘性颗粒流化质量方面所作的研究工作进行了总结。
在经济快速发展的今天,市场的竞争剧烈程度前所未有,企业为了应对挑战,在市场中占有一席地位,必须与其他企业合作。当前的竞争不单单是价格的竞争,还有非价格竞争,供应链中制
岱海流域内气候干旱,蒸发量大,水环境恶化,水量缺乏,对经济社会发展造成了影响。为了解决水量供需矛盾,有必要新建补水工程平衡水量。
报废汽车回收与再制造对资源和环境等绿色绩效具有重大影响,但针对回收与再制造全过程绿色要素间的结构关系以及数值演化关系尚未明了,因此,本文从系统工程的角度出发,建立回
随着医学信息化时代的到来,积累了大量的各种形式的医学信息。本文针对数据挖掘技术在医学领域的应用现状从各种层面上做了分析。
<正>我受常务理事会的委托,向大家作工作报告,请各位理事审议,请与会的专家、同志们提山意见.1 第六次全国代表大会以来的工作回顾自1999年3月召开中国热作学会第六次全国代
会议
人类文化知识的积累和传承,无疑是通过持续的分享和学习来实现的,而企业发展和传承也是如此。移动互联变革的今天,互联网思维对企业的组织创新与人才培养提出了更高的要求。
随着经济和互联网的发展,顾客行为的种类日益繁多,其影响力也变得越来越重要。相较于早已远远不能满足顾客需求的传统单一购买行为,时下新兴的口碑传播、推荐、互动以及媒体