基于图计算技术的在线教育平台推荐算法研究和实现

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:hally123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在这个互联网+的时代,在线教育平台得益于大数据的快速发展和数据挖掘技术的日趋成熟,相对于传统教育有着明显的优势。特别是推荐系统的出现和发展,让个性化教育的实现变得可能。本论文致力于探索一个适用于图计算技术的推荐算法,并以在线教育平台的数据为基础,设计一个基于显式评分数据的个性化课程推荐系统。论文首先对推荐系统中常见的冷启动和数据稀疏性问题进行了详细讨论,包括概念说明,常见的解决方案简述以及对本论文提出的基于数据转化和学生团体的数据稀疏性解决方案进详细描述。优化版的解决方案会分两步对用户-项目评价矩阵进行丰富,在兼顾个性化特性的同时缓解数据稀疏性问题。接着给出了整个推荐系统的模块划分和详细设计,其中主要包括日志模块,数据处理模块和推荐模块。其中日志模块承担的是数据采集工作,主要采集的是跟评分相关的用户行为数据和部分用户属性数据。数据处理模块需要定义推荐算法所需的数据模型,包括评分二部图模型和用户属性特征向量模型,并针对日志模块提供的不同类型的数据采用不同的处理技术进行转化。在推荐模块则提出了算法组的概念,以此应对推荐系统冷启动问题以及在算法选择的层面实现个性化。然后对几种传统的推荐算法进行研究讨论,并分析各自的利弊以及其对于图计算技术的适用性。从而引出基于二部图的推荐算法,因其与图计算模型完美契合以及在时间复杂度上的可控性,被选做本论文构建推荐系统所采用的核心算法。接着详细地论述了本论文对于朴素的二部图算法所做的优化和改进,其中包括全新的随机游走策略,在影响因子列表中纳入节点度概念,优化评分影响策略,以及将基于用户的协同过滤算法中用户相似度的概念引入进来用以提高整个推荐系统的推荐效果。最后通过实验对比了基于协同过滤的推荐算法和本论文提出的改进版二部图推荐算法在各参数指标下的具体表现。从实验结果中可以看出二部图算法虽然稳定性略有不足,但在推荐效果上占据着一定的优势,具体来说二部图算法和协同过滤算法相比,准确率和召回率都有一定程度的提高。
其他文献
火电厂是我国社会发展中十分关键的一个组成部分,对保证各地区电力正常供应具有十分重要的意义。以当前火电厂汽机高加运行情况为基础,分别阐述汽机高加泄露发生的原因,并提
目的:评价英国胎儿基金会(FMF)孕11-13+6周联合孕妇高危因素、血清学指标预测子痫前期模型的准确性,并回顾性分析模型中各指标与子痫前期的相关性。方法:收集孕妇病史资料,并
我国已有的《著作权法》、《商标法》和《专利法》虽然对非物质文化遗产提供了一定保护,但这些保护或略显单薄,或存在一定的局限。基于此,在整合各类私法法律的基础上,建构一
基于计算流体力学(CFD)方法,结合国际热核实验反应堆(ITER)中实际使用的设计参数,对硅酸锂球床的传热特性进行了流固耦合传热分析,给出了多种工况下的热工水力结果。同时将用CFD
本文描述了一种用于薄闪烁体的新型圆柱光导。实验表明,这种光导的光传输效率与扭曲光导相近,但新光导结构简单、紧凑,而且便宜。
[目的/意义]研究睡美人与王子文献的识别方法。分析唤醒机制,为未来在学术交流体系中发现“王子”作者,发掘、唤醒低被引和零被引文献的潜在价值提供理论依据。[方法/过程]采
通过对小儿雾化的原理介绍,叙述了小儿雾化治疗的作用。结合多年临床护理经验,从影响小儿雾化的心理因素角度出发,分析了患儿、家长两方面的心理影响因素,并从临床路径、护理
计算机课程教学和信息技术可谓是近水楼台,在计算机课程教学中都不乏信息技术手段的运用。在信息化如此普及的今天,能够合理使用现代信息技术手段,是提高课程教学质量的一个
生态资源是人类生存和社会发展的物质基础。生态产业是提供生态资源总量的一种重要方式和手段,并具有正外部性、前瞻性和综合性的特征。生态产业是在遵循物质循环和能量循环
<正>"诗以感为体",是马一浮诗学理论的中心命题。这一命题表达了他对诗歌本体的看法,是其诗歌本体论思想的最简要的表述。"诗以感为体"的命题频繁出现于马的论诗文字之中,但
会议