基于用户评分修正的协同过滤推荐算法

来源 :南京财经大学 | 被引量 : 0次 | 上传用户:sangyilin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网信息的爆炸式增长,造成了严重的“信息过载”的问题,人们很难找到自己感兴趣的信息,推荐系统应运而生,推荐系统通过给用户推荐他不了解但可能会感兴趣的内容来帮助用户获取信息。现今,推荐系统已经广泛应用在电子商务、新闻资讯、社交网站与视频音乐等领域。目前主流的推荐算法分为:基于协同过滤的推荐,基于内容的推荐和混合算法推荐等。其中协同过滤因为其不需要领域知识与推荐自动化程度高等优点成为了工业界使用最广泛的推荐算法,它通过应用一组与目标用户兴趣相似的近邻,来给目标用户进行评分的预测。在现实世界中,用户在给物品做出评分时可能会受到三种因素的影响:物品本身质量、用户自己的记忆作用和用户信任的社交好友对用户评分的影响。为了剔除这种影响,分析用户的真实偏好,找到与目标用户兴趣更加相似的近邻,从而提高推荐的准确度,本文提出了一种基于用户评分修正的协同过滤推荐算法。首先对比分析了现有物品质量评估方法的不足,提出了基于贝叶斯估计的物品质量评估方法。通过这种方法,我们不需要直接计算有限数量的估计值,取而代之的是计算出已知值的概率分布,然后利用这个概率分布来获取估计值,有效缓解了因评分数据不足而导致评估物品质量的偏颇问题。其次,研究了用户评分时存在的记忆作用,用户在评分时可能会受到记忆作用的影响,在特定的时间段内,会连续的给出相似的评分。通过实验分析了用户记忆作用的存在,提出了一种测度用户记忆作用的算法。然后,根据用户信任矩阵,构建信任网络模型。在用户信任网络中,用户之间的信任度越高,则用户之间更加相似,用户对信任他的用户的评分做出的影响就越大。在信任网络中,用户间不仅存在直接信任,还存在间接信任,本文提出一种在信任网络模型中,计算用户之间信任度的方法。最后,基于以上研究,本文提出了一种基于用户评分修正的协同过滤推荐算法(FixCF)。算法首先给出一种评分修正策略来消除物品质量,用户记忆作用和用户信任的社交好友这三个因素对用户评分的影响,将用户的评分进行修正。然后将修正后的评分重新应用到协同过滤算法中计算相似度,筛选与目标用户兴趣更加相似的最近邻,预测目标用户评分,并进行Top-N推荐。利用Movielens、Epinions和Flixster等数据集,将数据集划分成5个代表性的子集,分别进行实验论证,对比了FixCF和经典的协同过滤算法、现有的基于矩阵分解的算法和基于信任网络的推荐算法。实验结果证明,FixCF在多种条件下,准确率和覆盖率上都有着不同程度的提升。
其他文献
伴随着呈贡新区的发展,呈贡区出现大量“农转城”青年,“农转城”青年作为被动城镇化的特殊群体,处于社会边缘的弱势地位,他们中大多数既没有接受过高等教育,又缺乏有竞争力
高岭土作为一种重要的非金属矿,具有众多优良的理化性质和工艺性能。本文从高岭土成矿有利条件入手,优选研究靶区,在新的区域发现了新类型的优质高岭土矿床,并为该类型高岭土
本文通过静态失重实验、电化学方法、扫描电子显微镜和X射线能谱分析等表征手段,研究了降解餐厨废油提高原油采收率优势菌Pseudomonas sp.SWP-4菌株在生长周期内对回注水管线
商用铝合金具有优良的抗蚀性、易加工性、可焊性和优异的力学性能,作为工程材料被广泛地用于航空航天、轨道交通、汽车制造等领域。近年来,工程领域对设备及材料的减振降噪性
陕北黄土区降雨稀少,蒸发量大,是我国困难立地地区之一,植被重建是改善该地区生态环境,增加该地区森林生态系统效益的有效途径。黄土高原地区的坡面微地形分布广泛,在坡面尺
提高石油采收率的研究可从开采机理、流度控制、驱替液种类和油藏数值模拟等方面进行。为了得到油藏初期开采的驱替信息,就迫切地要求经济、高效的计算出水驱油信息。但运用
生物礁、滩油气藏属于勘探难度较大的隐蔽油气藏,但其中所蕴藏的石油天然气资源一直是世界瞩目的宝贵财富。龙岗地区位于四川盆地川中东北部,是目前川中钻探程度较低的区域。
目的Numb是重要的细胞命运决定子,在决定人胚胎干细胞的分裂方式中起重要作用。本实验用含有人Numb基因的慢病毒,感染人胚胎干细胞,建立人Numb基因过表达的人胚胎干细胞系,为
湖泊沉积物可用来指示不同水分条件下的搬运与沉积过程,研究湖泊沉积物特征对理解沉积动态过程及湖泊对其响应有着重要意义。青藏高原东北部位于东亚季风和盛行西风的交汇地
实体关系抽取旨在从大规模语料中抽取给定实体之间的语义关系,是知识库构建和智能问答等自然语言技术的重要基础。复述是指自然语言中的同质异构现象,用以描述语义相近但语法