论文部分内容阅读
互联网的发展让人们获取信息的方式越来越便利,但随之而来爆炸式增长的信息量,让用户如何从海量的信息中提取到有用的信息、提高信息的有效利用率成为亟待解决的问题。推荐系统的出现是解决这些问题非常有潜能的方向。且推荐系统是连接用户和信息的桥梁,现已应用在多个领域为用户、信息创造价值。推荐系统的成功应用离不开推荐算法的使用。现在应用较多的协同过滤算法从发展之初到现在已经成为互联网推荐中最常用的算法。关于协同过滤算法已经有学者做出了很多相关的研究,但是在数据稀疏、可扩展性等方面的问题仍然没有得到很好的解决。随着数据量的增加,这些问题会越来越突显。为了缓解数据稀疏和相似度计算不准确的问题,本文针对协同过滤算法做了以下方面的改进,具体内容如下:一.将加权Slope One算法引入到评分预测过程中,得到基于加权Slope One的混合协同过滤算法。通过加权Slope One算法基于项目的评分预测填充用户近邻集合内目标项目无评分的项目,缓解用户评分矩阵的稀疏性,提高了原协同过滤算法的推荐准确度。本文根据实验验证了算法的有效性。二.传统的相似度计算只考虑原有的用户项目评分信息使得相似度的计算不准确,因此提出了基于权重调节和用户偏好的混合相似度计算。首先融合反用户频率和共同评分行为的最小权重,降低流行物品的全局影响和共同评分数过少推荐准确度偏差。其次引入项目偏好词矩阵,在项目特征上计算有相同偏好的用户。最后将两者的相似度计算通过参数结合共同计算用户间的相似度,提高相似度计算的准确度。本文将相似度改进和加权Slope One预测填充后的协同过滤算法应用在MovieLens数据集中,通过分别实验对比分析,改进后的算法有较优的MAE、RMSE值,有更高的准确性,能够提升推荐效果。