WEB推荐系统中混合推荐算法的研究

被引量 : 0次 | 上传用户:rsbgrc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在互联网技术迅猛发展的今天,人们在获取信息的同时也在不断的创造新的信息。在这样一个充斥着海量数据的时代,用户很容易在信息的海洋中迷失。个性化推荐系统因为这个实际需求而产生,它通过分析用户在系统中产生的历史行为数据,预测用户的兴趣偏好,然后把合适的物品推送给用户。协同过滤算法是推荐系统中常用的技术,它可以分为两类算法:侧重于挖掘数据的局部特性或侧重于挖掘数据的全局特性,混合推荐算法可以将这两类算法加以结合来保持它们各自的优点。但是,协同过滤算法都面临着可扩展性差和数据稀疏性问题,尤其是侧重挖掘局部数据特性的协同过滤算法对数据稀疏性问题更加敏感。本文针对协同过滤算法及其混合算法面临的可扩展性问题和数据稀疏性问题,做了一些研究工作:1.研究设计了Weight-Slope One和RSVD模型等协同过滤算法在Hadoop分布式平台中并行化的求解方法,以解决用户行为数据中用户或物品规模庞大而导致算法面临可扩展性差的问题,该求解方法可用于本文提出的改进Weight-Slope One算法以及混合推荐算法中离线计算部分。然后,提出了利用相似性和时间因素来改进Weight-Slope One算法,提升了算法挖掘局部数据特性的能力。同时针对改进后算法面临的数据稀疏性问题,利用用户相关性信息和补全矩阵的方式,在一定程度上缓解了改进算法在面对稀疏数据时预测精度的损失。本部分研究内容提升了算法挖掘局部数据特性的能力和缓解了数据稀疏性造成的精度损失。2.在前面第一点的研究基础上,提出了基于改进后Weight-Slope One算法和RSVD模型的混合推荐算法,混合推荐算法的离线计算部分可使用前文研究设计的Hadoop平台下并行化的实现方案,实验结果显示,该混合算法能够更好的挖掘局部和全局的数据特性从而提升算法预测精度,同时在一定程度上更能适应数据的稀疏性。
其他文献
在干、湿烟气再循环方式下,建立采用空气启动方式的富氧燃烧循环流化床锅炉助燃气体动态计算模型和烟气成分动态变化计算模型。基于实际气体的P-R状态方程,采用偏离函数法建
视频监控在安全领域扮演着重要的角色,但视频监控通常只是录制现场视频图像,用于事后做证,缺乏主动性和智能性。在分析了视频监控系统的结构,介绍了可用于视频监控的生物特征
新型口服抗凝药物主要包括直接Xa因子抑制剂与直接Ⅱa因子(凝血酶)抑制剂,与传统抗凝药物相比具有无需常规监测、起效快、抗凝效果可预测、剂量固定、受食物与药物作用影响小等
文章分析了广州地铁二号线直流系统电流上升率di/dt和电流增量△I保护原理和动作过程,给出了保护整定原则以及广州地铁二号线1500V直流断路器的整定参数。
旧城历史文化街区的更新发展问题始终是旧城更新的核心问题和难点问题,随着社会经济的发展,人们原来越关注历史文化的保护与传承。成都作为拥有2300多年发展史的历史文化名城
目的 通过兰州市高中学生的肥胖成因及影响因素分析,为预防高中学生的肥胖提供理论依据。方法 运用访谈法和问卷调查法对兰州市高中二年级学生的肥胖成因及影响因素进行研究
【目的】探讨综述论文对影响因子的影响,分析高被引论文的特征,帮助编辑提高对高被引综述论文的理解。【方法】以国内材料学SCI收录期刊和国外材料陶瓷类SCI收录期刊为例,引
目的:分析与总结对血液透析患者血管通路并发症的预防与护理。方法:对136例血液透析患者的临床护理进行总结、梳理与分析。结果:血液透析患者血管通路并发症的护理主要包括皮下
对初中思想品德课程资源开发利用的现状进行了分析,并结合自身教学实践,对开发利用好课程资源提出一些见解,希望能为初中思想教育的发展有一定积极意义。
<正>与大多数传统媒体不同,21世纪经济报道内部一直采取扁平化的管理模式,各板块自成体系,分别拥有自己的采编团队、版面和APP频道。在媒体融合方面,各板块也拥有较大的自主