基于MovieLens数据集的协同过滤推荐系统研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:dailynice
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当今社会,互联网技术日新月异,各种新技术、新思想层出不穷,人类已经彻底告别了信息技术极端匮乏的岁月,慢慢步入信息日益过载的时代。在这个背景下,不管是信息的生产者还是消费者都将会受到一定程度的冲击。一方面,信息的生产者很难确保他们生产的信息能够被对其感兴趣的用户注意到;另一方面,信息的消费者很难从浩如烟海的信息中找出自己真正感兴趣的东西。推荐系统的出现就是为了帮助我们解决上面的这两个问题。它通过对用户先前行为信息的学习来为用户的兴趣爱好建模,并根据此模型来预测用户对未知物品的偏好,实现个性化的推荐。目前推荐系统已被部署到各大网站来为用户产生个性化的推荐列表,比如说Amazon、Hulu等。推荐算法的种类繁多,不过时至今日为大多数人所接受的是协同过滤推荐算法。因此本文介绍了协同过滤算法领域一些比较经典的算法,并提出了一些改进方案以使原有算法更为完善。最为重要的是,本文将协同过滤算法运用到电影推荐系统中去,使这一算法具体化,形象化。本文的主要工作如下:1.简单叙述了推荐系统在现实生活中不同领域的一些应用,并介绍了如何去判定一个推荐系统的好坏。2.深入分析了TopN推荐中基于邻域的算法,其实它又可以再细分为两种具体的算法,了解这两种算法的基本思想、基本步骤、优缺点及适用场合等等,并在原有算法的基础上提出了一些改进,最后在Movie Lens数据集上对这两种算法及其改进算法进行了实验。之所以要抽出一章来介绍TopN推荐,是因为TopN推荐问题更加切合于实际,也是未来的热点方向。3.详细介绍了评分预测中的协同过滤算法,相比于TopN推荐,评分预测的理论基础更加稳固,发展更为成熟。所谓的评分预测问题就是利用用户之前的打分行为来推断他对未有过行为的物品的具体打分值。这一部分是整个论文的重点,将继续讨论基于邻域的算法在评分预测问题中的应用,随之介绍了一种更为简单高效的协同过滤推荐算法Slope One,接着介绍了矩阵分解模型以及隐语义模型在评分预测中的应用,最后我们依然在Movie Lens数据集上对这部分提出的算法进行了离线实验。4.为了更加清楚地明白协同过滤推荐算法的核心思想,又开发了一种个性化的电影推荐系统,它是利用Apache Mahout实现的,在该推荐系统中包含了之前介绍过的所有推荐策略,用户可以自行选择使用。
其他文献
纠错码理论理论提出60多年来,在理论和工程应用中均取得了丰硕的成果,线性规划(Linear Programming,LP)译码就是其中之一。本文提出了一种新的多项式时间复杂度的LP译码算法,
传统直接扩频系统因其扩频通信方式而具有较强的抗高斯噪声和宽带干扰能力;因其多址通信特征而具有大容量通信的能力。本文在直扩系统基础上设计出一种混沌序列扩频系统,其应
论文结合高性能网络处理器技术研究项目,以IXP1200为参考,深入研究FBI(Fast Bus Interface)单元,设计FBI单元的整体结构,完成模块划分,采用Verilog HDL语言完成了FBI单元IP核的设计
第三代移动通信系统UMTS一开始就是为灵活地传递任意类型的业务而设计的。3GPP R5中引入了HSDPA技术使下行链路的峰值速率从2Mbps增加到了14.4Mbps。HSDPA采用自适应调制编码
随着Internet的快速发展,异构的计算环境下网络管理应用无论从规模上还是复杂性上都迅猛增长,不同的管理者和服务提供主机之间的共享管理数据逐渐增多,通信更加频繁,随之安全
BACnet作为楼宇控制网络中一种开放的数据通信协议,其最根本目的是要给楼宇自动控制系统提供实现互操作的方法,从而为不同厂家的设备间的整合问题提供了解决方案,现已在多个
本文利用SOPC技术实现了混沌加密算法。通过对混沌加密算法的特性进行分析比较,说明了混沌算法的密码学特性,选择了合适的混沌参数和初值,设计了密钥流发生模块,实现了数字混沌序
IP网络已经成为未来通信网络发展的主流方向,无论是固定的软交换体系结构还是第三代移动通信(3G)系统都将采用基于IP的分组交换网络,而信令系统作为通信网络的神经系统其重要
高频地波雷达利用高频垂直极化电磁波能够沿海洋表面绕射的机理,在海浪回波、强干扰和大气噪声背景下提取目标信息,从而实现对海上舰船目标和低空飞行目标的超视距探测。然而
Ad Hoc网络是一种无中心、自组织网络,能够不依靠任何固有设施建立起一个无线通信网络。Ad Hoc网络具有传统通信网络不可比拟的优势:不需要固定设施使Ad Hoc网络具有更好的经