论文部分内容阅读
本文主要通过推荐算法中的协同过滤实现对课程的推荐,协同过滤算法具有工程实现简单、模型通用性强等优点,然而基于协同过滤的推荐系统在面临实际问题时还存在很多不足,如在本文的课程推荐应用中存在的冷启动和可扩展性的问题。冷启动问题会造成新项目或新用户得不到合适的推荐甚至一直无法被推荐,可扩展性问题在用户和项目的体量急速增长的今天愈发严重,算法的计算复杂度过高造成推荐时效性下降,推荐算法在海量数据中的可扩展性亟待解决。从上述两个角度出发,本文做了以下研究:首先本文从课程推荐的实际应用出发,将Item-CF应用到课程推荐系统中。通过对不同相似度度量方法的分析与实验,观察课程推荐系统中课程的相似度度量方法对推荐结果的准确率的影响。实验证明,基于余弦值的相似度计算方式推荐准确率最高。其次,考虑到Item-CF中的用户评分矩阵稀疏性会导致推荐过程中部分课程无法计算相似度,本文提出通过课程属性的相似性对用户对课程偏好的相似性进行补充。一方面通过对相似性的填充解决了部分课程间相似度无法计算的问题,另一方面,由于课程属性的变化缓慢且可以根据系统中课程的说明数据直接得到,也适当的缓解了冷启动的问题。实验证明,该方法虽然在邻居规模取值较小时推荐准确率高于传统的Item-CF,在相同的推荐准确度下可以提高推荐效率,但是提升的幅度不大,只提高了约3.5%的准确率,且远小于该算法所能达到的准确率最大值。最后,基于实验结果和学生学习行为的分析,为了达到在提高效率的同时不损失推荐准确率,本文提出了基于课程热度的加权修正相似性算法(WHSCF)。实验证明WHSCF相比于传统的Item-CF算法能够同时提推荐的效率和准确率,在课程邻居规模较小的情况下,将推荐准确率提高11.8%,且准确度接近该算法和Item-CF算法所能达到的最优准确度。相比于传统Item-CF算法需要在邻居规模大于40时才能达到上述推荐准确度,WHSCF大大提高了计算的实时性。缓解了推荐的可扩展性问题。