Recommendations for K12 Math Exercises Based on Formula Features Extraction and Neural Cognitive Dia

来源 :华中师范大学 | 被引量 : 0次 | 上传用户:wangxingyu2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着线上教育的普及,海量的K12教育资源作为信息被共享到在线教育平台,越来越多的中小学生可以享受到互联网大数据的红利,在个性化教育与自适应教育中得到更好的发展。在智能教育领域,面向学生的个性化试题推荐一直是重要的研究课题,试题推荐技术帮助学生避免题海战术,通过针对薄弱知识点的定向学习来快速高效提升知识能力。在这种时代背景下,中小学生对于在线学习平台上的K12教育试题推荐需求日益迫切。数学作为一切学科的基础,不仅在K12教育中一直占据重要地位,更以其鲜明的体系结构、明确的章节知识划分、客观标准的题型与答案,成为众多线上教育系统青睐的学科资源。因此,本论文以针对K12数学学科的试题推荐技术为切入点展开研究工作,调研对比了传统方案,提出部分现存问题,并基于此提出创新性算法方案设计。目前主流的试题推荐方法模拟传统的基于协同过滤的商品推荐系统,将学生看作顾客,试题看作商品,通过模型对试题打分来进行推荐。然而将协同过滤运用到智能教育领域时,仅考虑了学生或试题间的共性特征,而忽略了学生和试题本身的个性特征,推荐结果可解释性较差。教育心理学中的认知诊断理论能够很好的解决这一问题,它通过试题Q矩阵与学生答题日志,诊断出学生的知识掌握情况,并基于此展开针对性试题推荐,使得推荐结果可解释性更强,推荐效果也更加精准。然而传统的认知诊断模型中的学生-试题交互函数往往由专家人工定义,主观性较强且方法低效,难以准确描述出二者复杂的交互逻辑。此外,传统认知诊断模型的计算规模往往与知识数量成指数关系,导致在处理大规模知识属性集(K12数学学科知识点为千量级)时性能较差。由于学生答题日志的有限性和稀疏性,即难以要求学生答题情况覆盖大部分知识点,易导致认知诊断模型训练效果不佳,对学生知识掌握情况的推断缺乏足够依据,继而造成推荐效果不准的情况。此外,学科知识点之间往往具有紧密的关联结构,如果将这些关联结构运用到推荐过程中,有望进一步增强推荐效果。认知诊断过程中用到的Q矩阵往往由专家人工标注,这一过程耗时耗力,将Q矩阵标注工作自动化是提升推荐系统性能的一个优化点。最后,数学等理工学科试题文本往往包含大量公式,这些公式中隐藏的知识点极易在知识抽取过程中被忽略。由于中文词汇不具有明显边界,一些知识点为多个词语的组合词,如何从组合词中选取最具代表性的知识概念点也是值得研究的问题。本论文针对将传统的试题推荐技术运用到K12数学领域时出现的问题,依次在三个环节提出创新性算法,分别是试题知识建模环节、学生建模环节,和基于这二者工作成果的试题推荐环节。它们有效解决了各自模块的性能瓶颈与可行性问题,提升了最终推荐结果的可解释性和准确性。本论文贡献的这三种方法可以被简略描述如下:1.试题建模:基于公式特征提取的知识抽取方法(BiLSTM+CRF+FFE)本论文第二章主要解决试题建模问题,提出的第一种方法名为基于公式特征提取的知识抽取方法。试题建模第一步往往通过词嵌入技术将题干转化可计算的序列,第二步通过关键词生成技术获取题目中的知识,如概率统计、序列标注、深度学习等方法。传统的知识抽取方案在应用到K12数学教育领域时存在数学公式知识点遗漏、组合候选词难以选取的问题。为此,本文提出的知识建模算法主要由三层处理层构成。第一层为Word2Vec+BiLSTM+CRF神经网络层,用于有效学习试题文本上下文信息并抽取出关键词汇,Word2Vec用于词嵌入,BiLSTM由前向LSTM和后向LSTM组成,用来更好的捕获试题的双向语义,CRF用于对最终的分类做约束,确保标签合法。第二层为公式特征抽取层,通过对LaTex公式组合范式的理解,分两路分别提取数学公式中的显式特征和隐式特征,从而实现对公式知识点的深度抽取。第三层为后处理层,通过进一步调整组合词汇的综合得分,来提升知识抽取的准确性。这套方案能够自动高效地标注出试题中的知识点,从而得到试题Q矩阵,为后续学生建模提供重要依据。在实验阶段,本文选取2018-2020各地区中考数学真题(无图客观题)作为实验数据,保证了试题知识点经过专家标注、知识点均匀分布、试题难度拉开梯度、以及题型的典型性,通过对比实验验证了公式特征抽取层和后处理层对知识抽取效果的提升。2.学生建模:基于DINA假设的神经认知诊断方法(NeuralDINA)本论文第三章主要解决学生建模问题,提出的第二种方法名为基于DINA假设的神经认知诊断方法。在这一环节,本文以教育心理学领域的认知诊断理论为基础进行研究。认知诊断主要通过学生的答题记录和试题Q矩阵来推断学生的认知状况,诊断结果可以被用作教育资源推荐、学生表现预测、小组分组等后续教育应用中。传统的认知诊断模型往往由专家主观设计的交互函数来模拟学生因子与试题因子之间的交互关系,难以准确捕捉二者复杂的交互逻辑;此外,面向K12数学领域的知识数目量级较大(2000+),由于传统的诊断模型在通过MLE算法进行参数估计时,计算规模与知识数目成指数关系,可行性较低。因此,本文提出的认知诊断方法利用神经网络,直接从答题数据和Q矩阵中学习学生与试题间的交互关系,而非人工设计交互函数,并将学生因子作为模型参数进行训练,训练结束后即得到诊断结果。模型的输入为学生因子与试题因子,通过三层网络结构,输出该学生在试题上的预测得分。网络第一层基于DINA假设,引入了猜测参数和失误参数,模型后两层为全连接层。使用神经网络来训练认知诊断模型能够更加智能高效地学习出学生-试题交互函数,同时也避免了因知识属性较多造成的计算规模指数爆炸问题,大大提升模型训练效率与可行性。在实验阶段,首先通过AVG与STD统计信息验证了数据集中学生知识状态的稳定性,接下来通过模型调参确立了最佳训练参数,并将认知诊断效果评估问题转化为分类问题,用分类问题常用指标(Flscore、AUC等)来评估该方法与传统认知诊断模型的性能差异,验证了 NeuralDINA模型的有效性与优越性。3.基于神经认知诊断与知识层级约束的试题推荐方法(NeuralDINA+KHC)本论文第四章为解决试题推荐问题,提出的第三种方法名为基于神经认知诊断与知识层级约束的试题推荐方法。传统的协同过滤推荐算法具有新用户冷启动和数据稀疏的问题,应用到教育资源推荐领域可解释性较差,即无法向学生说明推荐某一试题的原因,且推荐的试题不一定对学生的知识掌握水平提升有帮助。基于认知诊断的推荐则具有较好的解释性,能够针对学生的薄弱知识点做出针对性推荐。然而学生由于答题日志有限,也难以保证诊断结果的准确性和全面覆盖性。通过稀疏日志矩阵训练出来的模型预测某试题得分较低,可能是该试题考查的知识点未被日志覆盖导致,而并非学生真的未掌握。因此,本文提出一种的试题推荐方法以第三章中训练得到的学生诊断模型为基础,预测试题得分,再通过知识属性层级约束和试题难度控制,对分数做进一步优化调整,最后引入错题库,从中随机挑选部分试题加入待推荐试题集,生成一套构成丰富、针对性强、可解释性强的试题卷。学生做题情况得到反馈后,动态更新神经认知诊断模型与错题库,以便更加准确地分析学习者的知识掌握情况,继而在学习者知识状态变化后,依然能实现后续推荐。在实验阶段,知识层级由知识图谱构建而成,通过对近2200条K12数学公理的数据挖掘,提取出2000+个数学知识实体与2700条实体间关系,并从中抽象出6种实体关系类型(包含、等价、对立、相似、属性、前驱)和3种属性层级结构(前驱知识、后继知识、等价知识)。对于推荐部分,通过五种推荐方法的对比,验证了本推荐方法的有效性、优越性、与可解释性。综上所述,本研究主要贡献在于,针对K12数学教育领域,提出了一套具备可行性与创新性的个性化试题推荐方案,分别在试题知识建模、学生建模、试题推荐这三个环节提出创新性方法设计,有效解决了推荐流程中遇到的一些细节问题,对于智慧教育的发展具备一定的研究意义。
其他文献
蝉花在自然生长过程中会形成由菌丝特化而成的菌膜结构,对蝉花的生长发育有着重要作用。本研究以虫生真菌蝉花为研究材料,通过高通量测序技术了解蝉花在土壤和空气环境中的细菌群落差异以及细菌群落在不同生长阶段的变化规律,并对其潜在功能进行预测;然后观察蝉花在土气环境下菌膜的表观形态;再利用蝉花菌膜作为过滤介质对土壤细菌进行过滤,验证其是否对环境细菌具有选择滤过作用;最后通过稳定同位素15N标记技术对蝉花和土
镜面抛光新工艺张大庆作为热心的天文爱好者,我在九年前上高中时就开始进行天文反射镜面的磨制。经过几年的实践,我感到在遇到的所有难题中,抛光阶段镜面上检定出的各种面形误差是最让人伤脑筋的。有些误差,如“塌边”,几乎是难以抛光修正的,常常是经过了许多个不眠...
期刊
为疏通货币政策传导渠道、优化金融资源配置、支持经济高质量发展,我国加大了对结构性货币政策的运用。相较于传统的总量货币政策,结构性货币政策通过引入激励相容机制,来实现特定结构性目标。在实践过程中,特定结构性目标的实现依赖于特定金融机构的行为选择,地方法人银行扮演了重要角色。因此,激励相容机制是否可以有效调动地方法人银行运用的内在积极性,是决定结构性货币政策实施效果的关键因素。本文拟从地方法人银行行为
赖氨酸是家禽玉米-豆粕型饲粮中的第二限制性氨基酸,是家禽营养的研究热点。本试验旨在探究赖氨酸水平对贵州黄鸡生长和采食的影响,以确定0~6周龄贵州黄鸡日粮赖氨酸最适需要量,同时采用RNA-Seq和代谢组学技术挖掘赖氨酸调控采食的关键基因和标志代谢物,探究日粮赖氨酸通过下丘脑调控家禽采食量的分子机制,为家禽的采食量调控机制提供理论依据。试验一0~6周龄贵州黄鸡赖氨酸的需要研究选取1日龄贵州黄鸡雏鸡40
铁皮石斛作为药食同源类植物,含有多糖、石斛碱、酚类物质等活性成分,在我国具有悠久的药用历史。醋是一种酸性的健康食品,被广泛用作调味品或制成饮料直接饮用,其自身具有降血糖、抑菌、抗疲劳等功效。将二者相结合,既能更好地发挥醋的保健功效,又能为铁皮石斛产品多元化发展提供一定的依据。本文以铁皮石斛为原料,采用超声处理铁皮石斛鲜榨浆液以提高其多糖含量。以超声处理后的铁皮石斛浆和大米糖化液为原料利用酵母菌与植
刺梨(Rosa roxburghii Tratt)是一种蔷薇科植物,主要分布在中国西南地区,尤以贵州省的刺梨资源最为丰富。刺梨果实中含有丰富的维生素C、SOD、黄酮、多糖、多酚和三萜等物质。刺梨具有健胃、消食的作用,现代研究证实刺梨对坏血病、糖尿病、消化不良等疾病有着积极治疗效果,是一种药食两用型水果。但是,刺梨中含有大量的单宁,导致其口感酸涩,大多数人难以接受。本论文利用副干酪乳杆菌SR10-1
西南地区药食同源谷物苦荞、薏仁米作为灰树花菌丝体生长的固体培养基质,菌丝体在此培养基上能够正常的生长,且菌丝颜色洁白,结构致密。添加不同比例的中药天麻0~50%(g/g)参与灰树花发酵,以基质中总黄酮的分解程度、纤维素酶及淀粉酶的活性以及灰树花生长速率确定最佳天麻添加比例为40%。在40%的天麻添加量时,相较于空白组(0%),灰树花参与发酵12d后,对总黄酮的降解能力提高了1.3倍,显著高于空白组
苏麻饼粕是生产苏麻油的副产物,蛋白质含量高,氨基酸种类丰富,是优质的植物蛋白资源。然而目前苏麻饼粕的加工利用途径单一,主要被用作饲料、肥料及燃料等廉价处理或直接丢弃,这不仅极大浪费了其中的蛋白资源,而且影响苏麻的经济价值及其产业的发展。苏麻多肽是由苏麻饼粕蛋白水解得到的小分子肽,它具有比饼粕蛋白更优质的加工特性以及更丰富的生物活性。微生物发酵法通过微生物在生长代谢过程中产生蛋白酶来水解发酵基质中的
能源是21世纪最重要的话题之一。而可充电锂离子电池在便携式电子设备、电动汽车和大型储能系统中具有举足轻重的地位。钛酸锂负极材料因具有稳定的电压平台和“零应变”特性,且市售钛酸锂制备工艺简单。然而,钛酸锂负极材料的本征电子导电率和锂离子扩散速率较低、理论容量低,限制了其规模化应用。本文系统的探讨了粘结剂沥青/SiO、C/SiOx共包覆和C/TiO2双导电层对钛酸锂负极材料在电化学性能的影响。(1)本