面向个性化学习的数据挖掘方法与应用研究

来源 :中国科学技术大学 | 被引量 : 6次 | 上传用户：760904

【摘要】

：

个性化学习旨在根据学习者个体的认知水平、学习能力等,选择合适的学习资源与学习方式,使其弥补知识不足,获得最佳发展。近年来,在线学习系统的快速发展,不仅打破了传统课堂

【作者】

：

黄振亚

【出处】

：

中国科学技术大学

【发表日期】

：

2020年01期

【关键词】

：

个性化学习练习题表征注意力机制动态认知诊断个性化推荐深度强化学习

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

个性化学习旨在根据学习者个体的认知水平、学习能力等,选择合适的学习资源与学习方式,使其弥补知识不足,获得最佳发展。近年来,在线学习系统的快速发展,不仅打破了传统课堂学习的时空约束,还提供了丰富的学习资源,吸引了越来越多的学习者,留下了大量的学习数据。这些学习数据蕴含着巨大的科学及市场价值,为实现数据驱动的个性化学习服务,提供了有力的支撑。因此,如何利用数据挖掘等技术对学习者学习数据进行理解、分析,实践个性化学习,已经成为计算机及相关交叉学科的研究热点。现阶段,尽管基于认知心理学等理论的相关方法已取得了一定的成效,但在线场景中的个性化学习研究人面临着学习资源表征苦难、学习过程复杂易变以及学习策略难以量化等挑战。为此,本文系统性地开展了面向个性化学习的数据挖掘方法及应用的探索性研究工作。具体地,针对练习题对象,提出了练习资源的深度表征方法,并在语言类和逻辑类两类典型练习题目的应用中进行验证;针对学生对象,分别提出了融合学习因素的知识跟踪方法和融合题目语义的知识跟踪模型;针对学习策略对象,提出了基于多目标学习的个性化推荐方法,提高学生学习效率。本文的研究工作依托于科大讯飞开发的国内领先的在线学习平台系统“智学网”,研究问题和研究数据均来源于实际应用场景,且研究方案均在真实平台中验证,具有实际应用价值。本文主要的工作与贡献可以概括如下:首先,本文研究练习题深度表征方法。一方面,本文针对语言类练习,提出了基于语义理解的练习题表征方法。语义理解是语言类练习表征的基础,传统方法基于固定的规则匹配,忽略了题目文本的语义丰富和依赖等特点。本文将该类练习题表征分解成语句理解和语义关联两个部分,首先使用卷积神经网络提取句子级别特征,然后,基于注意力机制,量化练习文本对于题目的语义依赖。最后,针对于题目难度预测任务,提出一种基于偏序学习的模型训练方法,消除不同测试范围带来的难度误差。该方法在高考英语阅读理解难度预测任务中进行了大量实验验证,其结果表明该方法能够有效提高难度预测的准确性和稳定性。另一方面,针对逻辑类练习,提出了基于结构理解的练习表征方法。区别于语言类练习,逻辑类练习通常含有特定结构的元素(如公式)。然而,传统方法直接将其视为文本序列进行表征,忽略了其结构特性。本文首先设计辅助工具,构建练习层面的公式依赖图,然后提出基于点注意和边注意两种策略的图网络学习其结构表征。最后,提出嵌套序列模型,融合练习的文本语义和公式结构关联。在数学简答题自动解答任务中验证了该方法能够有效挖掘数学练习中的公式结构,提高解题精度。其次,针对于学生用户,本文研究动态认知诊断方法。一方面,考虑到知识关联因素和人脑记忆/遗忘因素对于学习活动的影响,提出一种融合学习因素的知识跟踪模型EKPT。该模型首先基于练习-知识关联信息,将学生和练习映射到具有明确含义的知识空间中。然后,融合教育学经典的学习曲线和遗忘曲线理论,在知识空间中量化建模了学生知识学习的演化过程。实验结果表明该方法提高了认知诊断的精度。另一方面,考虑到学习过程中的题目语义(知识共性语义和文本个性语义)的影响,本文提出一种融合题目语义的知识跟踪框架。该模型首先设计动态增强记忆网络存储知识共性信息,刻画了学生对于知识的动态掌握情况。其次,提出题目特征提取器,挖掘文本个性信息,且将其融入到学生的知识变化建模过程中。最后,本文分别基于马尔科夫性质和注意力机制两种策略,提出两种实例化模型。实验在大量学生练习记录上进行,结果验证了具有精准的预测性能和知识跟踪可解释性。最后,在学习策略设计方面,本文提出一种基于多目标学习的个性化推荐算法。区别于传统推荐系统,在线学习推荐任务具有更大的挑战。传统方法通常遵从“推荐未掌握的练习”的单一推荐策略,为考虑复杂学习目标(如复习与探索平衡性、难度平滑性、参与度等)的影响。为了解决此问题,本文设计了不同的回报函数量化三种学习因素,然后提出一种深度强化学习方法,在学生交互学习中协同优化多个因素,从而找到最优推荐结果。本文在离线和在线两类场景中进行实验,结果均充分显示了该推荐算法的有效性。

其他文献

2019年6月17日四川长宁M 6.0地震的快速测定与数据产品产出

2019年6月17日22时55分(北京时间),四川宜宾市长宁县发生了M6.0地震。中国地震台网中心用时10min发布正式速报结果,并开展余震监测和统计。同时,中国地震台网中心联合各有关

期刊

四川长宁地震地震速报余震监测数据产品

城市环境的监测及其治理措施分析

随着社会经济的迅速发展，城市已经成为人们主要的生活居住地。由于物质方面的极大丰富，我们对于我们的生活质量更加的关注，对我们附近的环境也是更加的关心，然而随着城市的不断扩

期刊

城市发展环境监测治理措施

“学习共同体”建设在高中数学总复习教学中的应用研究

搞好高三学生总复习阶段的教学,对于完善学生的知识结构和思维结构,系统掌握解决问题的具体方法,完成由知识到能力的迁移,提高学生分析问题和解决问题的能力,提高学生的数学

期刊

“学习共同体”建设高中数学总复习教学

基于复杂关系建模的短视频表示学习技术研究

短视频作为一种新兴社交媒介,具有时长短,入门简单,易于分享等特点,更加满足当前网络社交的需求。使其在十年之内得到了快速发展,经历萌芽期,成长期,如今已进入爆发期。然而,

学位

表示学习复杂关系建模短视频内容理解短视频场景分类短视频个性化推荐

多轴机床的自动松拉刀机构的锁刀分析研究

多轴机床加工表面质量好,加工效率高,自动松拉刀机构是多轴机床的关键部件,刀具的锁紧对工件的加工质量起到重要的作用。介绍了采用液压力驱动锁紧刀具,用液压力与机械的自锁

期刊

松拉刀铣头锁刀

云环境下密文数据的连接关键词检索技术研究

随着云计算、大数据等新兴信息技术的迅速发展,大量资源密集型计算任务被外包到云服务器。云计算模式给用户提供高质量数据服务的同时,也大大减轻了资源受限用户对数据的计算

学位

密文检索技术连接关键词检索多用户检索前向安全检索模式隐藏

无形资产评估质量控制研究述评

目前,无形资产评估已随着时代的发展引起人们的广泛关注,由于无形资产具有难以预测的特点,使无形资产评估的质量难以控制,这是当前相关工作人员面临的重大难题,为使这种状况

期刊

无形资产评估质量控制研究

ZY公司网络营销策略研究

成人高等教育学历以其独特的教育形式,发挥着普通高等教育的补充作用。但是,随着80年代的独生子女热,适龄考生人数每年都在减少。同时,由于普通高等院校扩招,成人高等教育面临生源减少这一重要的外部环境影响。ZY公司是专门从事成人学历教育的民办公司,随着国家政策对民办教育机构的扶持,大量民办机构涌入,想从中分享红利。ZY公司面临的竞争环境更加严峻,因此需要寻求营销策略的改进。科技发展突飞猛进,人们获取信息

学位

网络营销营销策略组合学历继续教育STP战略

基于大数据的安全管理系统在燃气发电厂中的应用

随着经济的发展,环保压力日趋明显,更多的人参与到保护环境、保卫蓝天的行动中,政府也采取了必要的环保措施,在北京关停燃煤发电厂,兴建燃气发电厂就是其中的举措之一。但是,

期刊

环保大数据燃气发电厂安全管理

促进南方红壤丘陵区农业可持续发展的复合农业生态系统长期观测研究

我国南方红壤丘陵区土壤质地黏重,透水性差,季节性降雨分布严重不足,极易发生水土流失;不合理的耕作措施加剧土壤侵蚀,导致土壤肥力下降,制约当地农业的可持续发展。1979年中

期刊

南方红壤水土流失耕地退化温室气体排放农牧复合可持续发展

面向个性化学习的数据挖掘方法与应用研究

其他学术论文