基于相似度改进的Item-CF课程推荐系统

来源 :华中师范大学 | 被引量 : 0次 | 上传用户:quakerb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文主要通过推荐算法中的协同过滤实现对课程的推荐,协同过滤算法具有工程实现简单、模型通用性强等优点,然而基于协同过滤的推荐系统在面临实际问题时还存在很多不足,如在本文的课程推荐应用中存在的冷启动和可扩展性的问题。冷启动问题会造成新项目或新用户得不到合适的推荐甚至一直无法被推荐,可扩展性问题在用户和项目的体量急速增长的今天愈发严重,算法的计算复杂度过高造成推荐时效性下降,推荐算法在海量数据中的可扩展性亟待解决。从上述两个角度出发,本文做了以下研究:首先本文从课程推荐的实际应用出发,将Item-CF应用到课程推荐系统中。通过对不同相似度度量方法的分析与实验,观察课程推荐系统中课程的相似度度量方法对推荐结果的准确率的影响。实验证明,基于余弦值的相似度计算方式推荐准确率最高。其次,考虑到Item-CF中的用户评分矩阵稀疏性会导致推荐过程中部分课程无法计算相似度,本文提出通过课程属性的相似性对用户对课程偏好的相似性进行补充。一方面通过对相似性的填充解决了部分课程间相似度无法计算的问题,另一方面,由于课程属性的变化缓慢且可以根据系统中课程的说明数据直接得到,也适当的缓解了冷启动的问题。实验证明,该方法虽然在邻居规模取值较小时推荐准确率高于传统的Item-CF,在相同的推荐准确度下可以提高推荐效率,但是提升的幅度不大,只提高了约3.5%的准确率,且远小于该算法所能达到的准确率最大值。最后,基于实验结果和学生学习行为的分析,为了达到在提高效率的同时不损失推荐准确率,本文提出了基于课程热度的加权修正相似性算法(WHSCF)。实验证明WHSCF相比于传统的Item-CF算法能够同时提推荐的效率和准确率,在课程邻居规模较小的情况下,将推荐准确率提高11.8%,且准确度接近该算法和Item-CF算法所能达到的最优准确度。相比于传统Item-CF算法需要在邻居规模大于40时才能达到上述推荐准确度,WHSCF大大提高了计算的实时性。缓解了推荐的可扩展性问题。
其他文献
展望2020年新冠肺炎疫情发生后中国金融,将呈现三个“重大”变化、三大“宽松”政策。  2020年春节前夕,新冠肺炎疫情突如其来,蔓延全国,扩散至海外部分国家和地区。巨大的“黑天鹅”飞起,2020年中国经济金融走向成为市场关注的话题。  不谋全局者,不足以谋一域;不谋万世者,不足以谋一时。分析经济金融发展,要全方位、多角度、动态化。上海现代服务业联合会金融科技服务专委会专家、上海银行原执行董事副行
目的探讨分析耐药性癫痫脑脊液P-糖蛋白(P-gp)、转化生长因子β1(TGFβ1)水平变化的临床意义。方法选取治疗有效的癫痫患者30例为敏感组,耐药性癫痫患者30例为耐药组,同期经
物理学的学科特点决定了实验不仅是物理教学的基础,也是引发学习兴趣,使学生主动获取知识,发展能力,提高科学素质的基本途径。物理实验按来源形式目的的不同,可分为四类:演示实验学生分组实验课内小实验课外实验。下面就如何在各类实验中激发培养学生的学习兴趣,谈一些具体的要求及粗浅的改进意见。    一演示实验    1.演示实验要生动直观形象,极易引起学生的直接兴趣,增强学生学习的积极性。如讲燃烧的三个条件
目的:总结高血压性脑出血的临床特征,探讨高血压性脑出血的危险因素和保护因素,提供高血压性脑出血预防的新思路,探讨高血压性脑出血健康教育和健康促进新途径。方法:采用1:1
受力分析是解决物理问题的关键步骤,而研究对象的选取又是受力分析的必要环节.在确定研究对象时通常会用到整体法和隔离法,尤其是在处理连接体问题时,往往随着研究对象的转化
详细介绍了脉动水锤装置的结构及其工作过程,对锤击时柱塞组件的运动以及冲击压力波产生和传播机理进行了分析,分析表明这种水锤装置能够产生的水锤压力包括水锤静压力和冲击