论文部分内容阅读
随着线上教育的普及,海量的K12教育资源作为信息被共享到在线教育平台,越来越多的中小学生可以享受到互联网大数据的红利,在个性化教育与自适应教育中得到更好的发展。在智能教育领域,面向学生的个性化试题推荐一直是重要的研究课题,试题推荐技术帮助学生避免题海战术,通过针对薄弱知识点的定向学习来快速高效提升知识能力。在这种时代背景下,中小学生对于在线学习平台上的K12教育试题推荐需求日益迫切。数学作为一切学科的基础,不仅在K12教育中一直占据重要地位,更以其鲜明的体系结构、明确的章节知识划分、客观标准的题型与答案,成为众多线上教育系统青睐的学科资源。因此,本论文以针对K12数学学科的试题推荐技术为切入点展开研究工作,调研对比了传统方案,提出部分现存问题,并基于此提出创新性算法方案设计。目前主流的试题推荐方法模拟传统的基于协同过滤的商品推荐系统,将学生看作顾客,试题看作商品,通过模型对试题打分来进行推荐。然而将协同过滤运用到智能教育领域时,仅考虑了学生或试题间的共性特征,而忽略了学生和试题本身的个性特征,推荐结果可解释性较差。教育心理学中的认知诊断理论能够很好的解决这一问题,它通过试题Q矩阵与学生答题日志,诊断出学生的知识掌握情况,并基于此展开针对性试题推荐,使得推荐结果可解释性更强,推荐效果也更加精准。然而传统的认知诊断模型中的学生-试题交互函数往往由专家人工定义,主观性较强且方法低效,难以准确描述出二者复杂的交互逻辑。此外,传统认知诊断模型的计算规模往往与知识数量成指数关系,导致在处理大规模知识属性集(K12数学学科知识点为千量级)时性能较差。由于学生答题日志的有限性和稀疏性,即难以要求学生答题情况覆盖大部分知识点,易导致认知诊断模型训练效果不佳,对学生知识掌握情况的推断缺乏足够依据,继而造成推荐效果不准的情况。此外,学科知识点之间往往具有紧密的关联结构,如果将这些关联结构运用到推荐过程中,有望进一步增强推荐效果。认知诊断过程中用到的Q矩阵往往由专家人工标注,这一过程耗时耗力,将Q矩阵标注工作自动化是提升推荐系统性能的一个优化点。最后,数学等理工学科试题文本往往包含大量公式,这些公式中隐藏的知识点极易在知识抽取过程中被忽略。由于中文词汇不具有明显边界,一些知识点为多个词语的组合词,如何从组合词中选取最具代表性的知识概念点也是值得研究的问题。本论文针对将传统的试题推荐技术运用到K12数学领域时出现的问题,依次在三个环节提出创新性算法,分别是试题知识建模环节、学生建模环节,和基于这二者工作成果的试题推荐环节。它们有效解决了各自模块的性能瓶颈与可行性问题,提升了最终推荐结果的可解释性和准确性。本论文贡献的这三种方法可以被简略描述如下:1.试题建模:基于公式特征提取的知识抽取方法(BiLSTM+CRF+FFE)本论文第二章主要解决试题建模问题,提出的第一种方法名为基于公式特征提取的知识抽取方法。试题建模第一步往往通过词嵌入技术将题干转化可计算的序列,第二步通过关键词生成技术获取题目中的知识,如概率统计、序列标注、深度学习等方法。传统的知识抽取方案在应用到K12数学教育领域时存在数学公式知识点遗漏、组合候选词难以选取的问题。为此,本文提出的知识建模算法主要由三层处理层构成。第一层为Word2Vec+BiLSTM+CRF神经网络层,用于有效学习试题文本上下文信息并抽取出关键词汇,Word2Vec用于词嵌入,BiLSTM由前向LSTM和后向LSTM组成,用来更好的捕获试题的双向语义,CRF用于对最终的分类做约束,确保标签合法。第二层为公式特征抽取层,通过对LaTex公式组合范式的理解,分两路分别提取数学公式中的显式特征和隐式特征,从而实现对公式知识点的深度抽取。第三层为后处理层,通过进一步调整组合词汇的综合得分,来提升知识抽取的准确性。这套方案能够自动高效地标注出试题中的知识点,从而得到试题Q矩阵,为后续学生建模提供重要依据。在实验阶段,本文选取2018-2020各地区中考数学真题(无图客观题)作为实验数据,保证了试题知识点经过专家标注、知识点均匀分布、试题难度拉开梯度、以及题型的典型性,通过对比实验验证了公式特征抽取层和后处理层对知识抽取效果的提升。2.学生建模:基于DINA假设的神经认知诊断方法(NeuralDINA)本论文第三章主要解决学生建模问题,提出的第二种方法名为基于DINA假设的神经认知诊断方法。在这一环节,本文以教育心理学领域的认知诊断理论为基础进行研究。认知诊断主要通过学生的答题记录和试题Q矩阵来推断学生的认知状况,诊断结果可以被用作教育资源推荐、学生表现预测、小组分组等后续教育应用中。传统的认知诊断模型往往由专家主观设计的交互函数来模拟学生因子与试题因子之间的交互关系,难以准确捕捉二者复杂的交互逻辑;此外,面向K12数学领域的知识数目量级较大(2000+),由于传统的诊断模型在通过MLE算法进行参数估计时,计算规模与知识数目成指数关系,可行性较低。因此,本文提出的认知诊断方法利用神经网络,直接从答题数据和Q矩阵中学习学生与试题间的交互关系,而非人工设计交互函数,并将学生因子作为模型参数进行训练,训练结束后即得到诊断结果。模型的输入为学生因子与试题因子,通过三层网络结构,输出该学生在试题上的预测得分。网络第一层基于DINA假设,引入了猜测参数和失误参数,模型后两层为全连接层。使用神经网络来训练认知诊断模型能够更加智能高效地学习出学生-试题交互函数,同时也避免了因知识属性较多造成的计算规模指数爆炸问题,大大提升模型训练效率与可行性。在实验阶段,首先通过AVG与STD统计信息验证了数据集中学生知识状态的稳定性,接下来通过模型调参确立了最佳训练参数,并将认知诊断效果评估问题转化为分类问题,用分类问题常用指标(Flscore、AUC等)来评估该方法与传统认知诊断模型的性能差异,验证了 NeuralDINA模型的有效性与优越性。3.基于神经认知诊断与知识层级约束的试题推荐方法(NeuralDINA+KHC)本论文第四章为解决试题推荐问题,提出的第三种方法名为基于神经认知诊断与知识层级约束的试题推荐方法。传统的协同过滤推荐算法具有新用户冷启动和数据稀疏的问题,应用到教育资源推荐领域可解释性较差,即无法向学生说明推荐某一试题的原因,且推荐的试题不一定对学生的知识掌握水平提升有帮助。基于认知诊断的推荐则具有较好的解释性,能够针对学生的薄弱知识点做出针对性推荐。然而学生由于答题日志有限,也难以保证诊断结果的准确性和全面覆盖性。通过稀疏日志矩阵训练出来的模型预测某试题得分较低,可能是该试题考查的知识点未被日志覆盖导致,而并非学生真的未掌握。因此,本文提出一种的试题推荐方法以第三章中训练得到的学生诊断模型为基础,预测试题得分,再通过知识属性层级约束和试题难度控制,对分数做进一步优化调整,最后引入错题库,从中随机挑选部分试题加入待推荐试题集,生成一套构成丰富、针对性强、可解释性强的试题卷。学生做题情况得到反馈后,动态更新神经认知诊断模型与错题库,以便更加准确地分析学习者的知识掌握情况,继而在学习者知识状态变化后,依然能实现后续推荐。在实验阶段,知识层级由知识图谱构建而成,通过对近2200条K12数学公理的数据挖掘,提取出2000+个数学知识实体与2700条实体间关系,并从中抽象出6种实体关系类型(包含、等价、对立、相似、属性、前驱)和3种属性层级结构(前驱知识、后继知识、等价知识)。对于推荐部分,通过五种推荐方法的对比,验证了本推荐方法的有效性、优越性、与可解释性。综上所述,本研究主要贡献在于,针对K12数学教育领域,提出了一套具备可行性与创新性的个性化试题推荐方案,分别在试题知识建模、学生建模、试题推荐这三个环节提出创新性方法设计,有效解决了推荐流程中遇到的一些细节问题,对于智慧教育的发展具备一定的研究意义。