论文部分内容阅读
相似度计算是基于近邻的协同过滤算法流程中的一个重点,其决定了用户的近邻,而用户的近邻则会影响到推荐给用户的项目评分,最终影响到用户能看到的推荐列表,其方法的有效性会直接决定推荐结果的质量。传统的推荐算法在计算用户之间的相似度时,需要获取两个用户评分的项目集合,然后取其交集进行下一步计算,利用评分之间的距离或者是线性关系去捕捉用户之间的相似度,无法充分利用评分中的信息。在消费类推荐系统中的新用户冷启动情况下,更是由于共同评分项目的缺乏,无法挖掘用户的兴趣爱好。本文扩展了传统协同过滤算法中共同评分项目的范围,提出了相似评分项目的概念,解决了冷启动情况下共同评分项目缺乏的问题;将相似评分项目与从评分数据中挖掘的用户共同偏好相结合,提出了一种基于相似项目和用户共同偏好的个性化推荐算法,通过实验验证,该算法较好地缓解了消费类推荐系统中的新用户冷启动问题。本文主要工作包括:(1)介绍了推荐算法的研究意义,分析了协同过滤算法以及其中相似度算法的重要性以及当前的研究现状。(2)介绍了主流的推荐算法,分析了它们各自的优缺点。(3)分析了推荐系统中冷启动问题出现的原因,以及常见的解决方式。通过介绍用户之间非对称的影响,说明了非对称因子存在的必要性。(4)使用具体实例对协同过滤算法中的相似度计算的算法进行了分析,挖掘这些算法计算出现误差的原因,分析了它们的优缺点,提出了基于用户偏好的非对称算法。(5)基于上述分析,挖掘了其中问题出现的原因,分析了在冷启动情况下,这些算法效果较差的原因,在此基础上将协同过滤算法中共同评分的范围扩展为相似评分项目,将共同评分的相似物品纳入相似度计算范围,与基于用户共同偏好的算法结合,最终形成基于相似评分项目和用户共同偏好的推荐模型。(6)利用Movie Lens-100K数据集进行实验,与其他8种算法进行对比分析。实验结果表明,本文所提出的算法在非冷启动情况下,可达到较好的推荐效果。在不同程度的冷启动情况下,可充分利用用户有限的评分信息,挖掘用户的偏好,为用户进行合理的推荐,达到了很好的效果。