基于动态K近邻和多权值的Slope One推荐算法研究

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:xs0405010154
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网和信息技术的快速发展满足了人们对信息的需求,但人们在享受其带来便利的同时,也面临着信息过载的问题。为了解决这一问题,推荐系统应运而生,并在电影、社交、电子商务等多个领域得到了广泛的应用。推荐算法作为推荐系统的核心,近年来一直是研究的热点,其中应用最广泛和成功的是协同过滤推荐算法。加权Slope One算法作为一种基于项目的协同过滤,其采用线性回归进行评分预测,简单、高效且易于实现,被广泛研究。然而该算法无差别对待所有用户数据,且未深入考虑用户或项目间的联系,其评分预测过程存在一定缺陷。因此,本文对此展开研究,具体的研究工作和创新点如下:1.针对加权Slope One算法在计算项目间评分偏差时,考虑了所有共同评分的用户,难免会引入大量干扰数据影响预测结果的问题,本文提出一种改进的基于动态K近邻的加权Slope One算法。首先,在修正余弦相似度的基础上引入平衡因子、时间权重和热门项目惩罚因子,并与欧几里得相似度进行组合来优化近邻度量方法。然后,设置用户相似度阈值和近邻数,以双重阈值的方式对近邻选择方法进行改进。最后,采用改进的动态K近邻方法筛选近邻用户集,以保证只有与目标用户偏好相似的用户数据才能参与到项目间评分偏差的计算中,从而提高评分预测的准确度。2.通过对干扰数据进行过滤,一定程度上提高了加权Slope One算法的预测准确度。但其评分预测的过程主要依赖项目间评分偏差和项目共同评分的用户数,而未深入挖掘用户或项目间的联系,在评分数据稀疏的情况下算法准确度并不理想。对此,本文提出一种改进的基于动态K近邻和多权值的Slope One算法。该算法在之前改进基础上,分别将改进的用户相似度、信任度和项目相似度作为权重因子加权到评分预测的过程中,以区别对待不同的用户和项目,从而进一步提高预测的准确度。最后,在Movie Lens数据集中进行改进算法的实验验证。实验结果表明,改进后的算法有效地提高了评分预测的准确度。
其他文献
视觉目标跟踪技术主要是利用视频序列图像中视觉目标的时间连续性和空间连续性对目标进行跟踪,视觉目标跟踪技术在国防军事和保障居民安全等方面均有着广阔的应用前景。此外,其研究涉及计算机视觉和模式识别相关技术,具有重要的理论研究价值。然而视频中目标与背景都随时间变化,并受多种因素如光照变化、背景杂乱、目标模糊等的影响,这给视觉目标跟踪技术带来很大的挑战。近年来,深度学习方法从大量的数据进行网络训练,在目标
社交网络已经成为人们现代生活中必不可少的一个部分,逐渐改变了人们很多传统的习惯。人们浏览新闻的途径已经从纸张阅读逐步趋于线上,新闻媒体可以通过社交网络发表新闻评论
Gossip算法因其简单、高效、健壮,可扩展性和抗干扰能力强的特点,应用场景十分广泛。最初,Gossip算法只是通信领域信息传播的重要方法之一,但是随着去中心化网络的发展,Gossip算法的应用领域不断扩大。目前Gossip算法的应用有数据库复制、聚集计算、网络拓扑的构造、故障检测、网络监控、路由技术等。另外,Gossip算法还是区块链技术的底层协议之一。为了改善Gossip算法在信息传播过程中的
高速发展的自然语言处理技术已越来越频繁地在生活中应用,人们通过这种技术进行兴趣推荐、机器翻译以及制作问答系统等。现今自然语言处理应用都集中于英语或现代汉语上,但在
互联网的设计初衷是解决两点之间的通信问题,但是随着进入大数据时代,各类互联网应用及服务更迫切需要一个能够实现内容快速分发、高安全的承载网络。在这种背景下,以内容为
在大数据背景下,社会活动呈现出数字化、复杂化的趋势,公安机关为更好应对这一社会现象,在其行政执法过程中利用第三方数据是不可或缺的,且利用的范围和频率与日俱增。但是,
泛在电力物联网的快速发展,带来了更多的应用场景和更大的应用空间。用电信息采集系统作为泛在电力物联网的一部分,其应用也在发展,产生新的应用需求。而当前的应用协议已无
稀疏性重构是近几年快速发展的一类问题,在许多交叉学科有着广泛的应用。随着人类信息获取能力的不断提高,产生的数据量成倍增长,如何存储,传输,并利用这些数据挖掘出有价值
图像分割是图像识别,目标跟踪等任务的预处理步骤,在图像处理中占据重要地位,可用于医学检测和交通控制等多个与计算机视觉相关的方面。但是图像分割由于待分割图像数据的特殊性和多样性,一直没有通用的方法出现,同时平衡图像分割的精确度和算法的实施性也是研究过程中一个需要考虑的问题。水平集方法由于其自由变换拓扑结构的特点,在图像分割领域取得了优秀的分割结果。本文对水平集理论及水平集方法在图像分割中的应用进行了
大数据时代的到来,使得数据的使用、收集、储存方式发生了重大的变化:它彻底改变了记忆的模式,将人脑“短暂性”的记忆转变为数据“永久性”的记忆。数据化是一把双刃剑,它在