基于类别的混合协同过滤算法研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:green_wong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络和电子商务的快速发展,信息的爆炸性增长在给人们带来便利的同时,也给人们带来了如何在大量信息中选择所需求资源的困惑。而推荐系统就是一个帮助用户解决信息过载问题的一种智能代理系统。无论是在研究领域还是应用领域,协同过滤算法都是个性化推荐系统中最成功的算法之一。它基于的假设是:在过去兴趣相似的用户也倾向于在未来喜欢相同的东西。协同过滤算法的最大优势在于它并不基于任何内容信息,因此可以处理音乐、电影和照片等无结构的项目。但与此同时,协同过滤算法也存在着问题亟待解决,那就是稀疏性问题。为了缓解稀疏性问题,本文中提出了一个改进的协同过滤算法,名为基于类别的混合协同过滤算法。该算法在四个主要方面提高了推荐系统的准确性:首先,本文算法利用项目的类别信息,将项目按照其类别信息分类,形成项目-类别矩阵,并根据用户-项目矩阵和项目-类别矩阵构建了用户-类别矩阵。这个过程将一个高维度的矩阵转化为了一个低维度的矩阵。其次,本算法改进了用户相似度和项目相似度公式,通过在原有相似度计算公式中加入一个基于打分交集计算的相关权重的方法,解决了当用户(或项目)打分交集较少时相似性计算不准确的问题。再次,本文提出了一个新的缺失数据预测策略,也就是在我们改进了的基于用户的协同过滤算法运算过程中,先使用改进了的基于项目的协同过滤算法对空白评分进行预测的方法。最后,我们为每个用户构造了用户最近感兴趣的类别云,将用户倾向可能随着时间发生改变的因素考虑在内,进一步提高了算法的准确性。在实验中,我们使用MovieLens10M的一个扩展数据集作为数据源,使用平均绝对误差(MAE)和均方根误差(RMSE)作为评测指标,使用交叉验证的方式设定了参数值。通过使不同训练集所占整体数据集的比例不同,我们比较了本文所提出的算法与传统的基于用户的协同过滤算法和基于项目的协同过滤算法的精确性差距。实验表明,我们提出的算法在所有的情况下都比其他两种算法在性能上有了明显的提升,MAE的最大的提升比率为22%, RMSE最大的提升比率为28%.不仅如此,在提升率曲线上可以看出,训练集的数据越是稀疏,我们算法的优势便越发明显。因此我们可以相信,我们的算法的确有效的缓解了稀疏性问题,提高了协同过滤算法的精确度。
其他文献
协作学习(CollabomtiveLeaming,简称CL)是学习者以小组形式参与,为达到共同的学习目标,在一定的激励机制下为获得最大化个人和小组学习成果而进行的一切相关行为。基于Ontology
P2P技术已经使互联网格局发生了巨大的变化,改变了以往网络以服务器为中心的模式,使广大的互联网用户群体加入到网络共享的过程中来,有效的发掘了网络共享资源的潜力,为所有
惰性学习(Lazy Learner)分类法有别于决策树归纳、贝叶斯分类、基于规则的分类、后向传播分类等的急切学习分类技术。当给定训练集时,惰性学习法只是简单的存储它,而不像急切
目前,人们的工作和生活已经离不开嵌入式系统,各种各样的嵌入式设备例如移动终端、数字化设备、网络设备、各种传感器以及工业控制设备和办公自动化设备等被广泛应用,大大的提高
随着计算机技术的发展,软件系统尤其是基于网络实现的分布式应用系统应用越来越广泛,系统性能被列为系统质量的重要指标,并越来越受到人们的重视。系统性能测试通过自动化的测试
随着信息产业的蓬勃发展,软件所扮演的角色越来越重要。在软件产业的发展过程中“软件危机”逐渐暴露出来。研究发现,“软件危机”的实质是缺乏对软件项目进行过程管理。对于中小软件企业,由于自身人力资源匮乏且人员流动量大、资金少和制度的不完善等原因,实施软件质量管理存在更多的困难。本文在开发一个质量保证系统之前对程序的开发框架进行了研究,提出了一个在中小软件企业中普遍适用的开发框架。针对中小软件企业自身的特
对于很多网络应用,高效可靠的互联网性能参数测量对其是否能正常工作至关重要,尤其是与语音、视频传输相关的应用。由于互联网的异构性和复杂性,许多现有的网络测量方法尚不完善
程序挖掘是网络环境下实现按需定制服务的一种新型的网络计算模式。它的基本思想是:分析用户计算需求,从构件资源库中检索获取所需构件,并把这些构件组装成满足用户需求的程
Adhoc网络具有自组织、无中心、动态拓扑等特点,广泛应用于民用、军事、救灾等各个领域。现有的Adhoc安全路由协议,大多运用密码学手段对路由消息进行安全操作,提供路由消息
随着空间数据获取技术的快速发展,空间数据的数量、大小和复杂性都在急剧增加,已经远远超出了人们的解释能力,致使“空间数据爆炸但知识贫乏”。因此,利用空间数据挖掘和知识