协同过滤算法研究及应用

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:triyve
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的迅速发展,网络上的信息呈爆炸性增长,人们不得不思考如何从海量信息中过滤出有效信息。推荐系统正是解决信息过载的有效技术之一。在过去十几年中,推荐技术相关的研究成果不断涌现,各种推荐算法被提出,协同过滤算法是其中应用最广泛的算法,具有重要的研究价值与研究意义。本文的研究工作主要如下:(1)对推荐系统进行了整体的学习,总结了推荐系统的研究背景与研究现状,并对当前流行的几类推荐算法进行了研究、比较,对其中的协同过滤算法进行了重点学习。针对协同过滤中的关键算法的实现,相似度度量,评价指标进行了详细的阐述。(2)针对个人个性化推荐,提出了两个基于矩阵分解的改进模型,分别为基于类别加权的矩阵分解模型CW-MF和基于近邻影响和类别加权的矩阵分解模型NICW-MF。第一个模型利用物品的类别信息,考虑不同用户对不同类别的兴趣度不同;第二个模型在考虑物品类别影响的情况下,考虑了近邻用户对用户的影响力,从而得到了改进的模型。在MovieLens数据集上进行了大量的实验,验证了物品类别和近邻用户确实对用户的选择起到了引导作用。(3)针对群组个性化推荐问题,提出了基于近邻影响的主题模型的群组个性化推荐方法。该模型模拟了群组选择物品的生成过程,不仅考虑了群组的主题,群组内成员的个人兴趣,同时考虑了群组成员的近邻用户的影响。本文详细介绍了 NUIT模型,参数推导过程,以及如何利用该模型对群组进行个性化推荐。最后,在群组数据集上进行大量实验,充分验证了该模型的有效性和准确性。(4)针对推荐系统中数据量过大问题,实现了基于Spark的用户间相似度并行化计算。本文在MovieLens数据集上进行了实验,验证了并行化计算的高效性,可见并行化可以充分提高推荐系统在大数据下的处理能力。
其他文献
随着科技的发展,电离层对卫星导航、无线电通信、广播、空间探测等人类活动的影响越来越显著。因此,电离层的探测技术也越来越重要。非相干散射雷达具有时空分辨率高、覆盖空
从单幅图像中提取其中的层次关系是实现图像分析的基础,也是深层次图像信息提取问题的基础。该研究的运用面很广,可以应用到图片理解(目标识别、姿态估计)、机器人视觉(运动
即时编译器将输入型程序,如JavaScript程序(简称js程序),编译为本地可执行代码,这为攻击者提供了便利。攻击者可利用js程序中受控制的常量构造攻击时所需的代码片段(称为gadg
随着移动互联网产业快速发展,Android移动智能终端的普及,移动应用创新不断,移动应用内容已覆盖人们生活的各个方面。用户对移动应用的需求,使得更多开发人员加入应用开发的
随着互联网的快速发展与普及,网络已经成为了现代人工作、学习和生活必不可少的一部分。但是在设计之初,没有考虑到互联网会被广泛的使用。如今网络的主要用途由共享设备变为
协整理论,特别是多重协整理论,目前已经得到了广泛的应用,从微观经济到宏观经济,从农业到金融业,多重协整理论已经成为了一种有力的工具,但是由于对多重协整理论的认识不深,
目的:研究不同浓度的舒芬太尼单独或联合顺铂对人肺癌A549细胞增殖、凋亡、迁移、侵袭及上皮间质转化的影响,为肿瘤患者围术期镇痛及癌痛治疗提供依据。方法:培养人非小细胞肺癌A549细胞,将A549细胞培养于采用含10%胎牛血清,1%双抗(青链霉素混合液)的RPMI-1640培养液,置于37℃,5%CO2的培养箱中进行培养。分组为:对照组、舒芬太尼(0.01、0.05、0.25μg/mL)组、顺铂(5
近年来随着互联网技术的快速发展,网络中传输的数据量越来越大,对网络内容检测设备性能的要求也就越来越高。传统的管理网络策略已经无法适应大流量、高性能及复杂程度高的网
本研究采用多种范式,考察听写困难儿童在客体空间信息和客体特征信息的编码特点,研究内容共包括四个部分:实验1.1考察听写困难儿童和正常儿童空间位置辨别的能力。结果表明:
工业机器人由于体积庞大、不能灵活移动、适应周围环境能力差、稳定性低等诸多缺点,越来越不能满足人们对各种恶劣环境下的要求,目前人类开始着手研究能够在极端环境下满足自