曼哈顿距离判别法:一种混合计分非参数诊断法的构建

来源 :中国心理学会,中国教育学会 | 被引量 : 0次 | 上传用户:skykoo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  在认知诊断评估中,用于诊断分类的方法多为参数模型,参数估计的实现需要具备一定的数学和计算机知识,较大程度地限制了认知诊断评估在实践中的应用和推广。近年来,研究者开始将非参数方法引入到对被试知识状态的诊断与分类中,因其具有无需前提假设、操作简单、耗时少、不依赖于样本量等特点,适于认知诊断评估的应用和推广。非参数方法中,基于观察反应模式(Observed Response Pattern,ORP)与理想反应模式(Ideal Response Pattern,IRP)间的海明距离判别法尤为简单,只需计算ORP与IRP间的简单距离就可实现对被试知识状态的分类与诊断。然而,海明距离只适于0-1计分数据,随着测验形式和评分方式的多样化,此时仍采用仅适于0-1评分的分类方法,将不能充分利用作答信息,影响诊断分类的准确性。从数理上说,海明距离是曼哈顿距离的特例,本研究拟通过将海明距离纳入适于多级评分的曼哈顿距离,构建一种适用混合计分的曼哈顿距离判别法(Manhattan Distance Discriminating Method,MDD),并从数学上证明该方法用于诊断评估的分类一致性,然后通过模拟研究考查MDD的分类准确性及稳定性。
其他文献
在当前世界范围内兴起的核心素养(也称21世纪技能)研究热潮中,核心素养的测评问题是教育测量与评价界不可回避的问题。从世界各个国家、各类组织定义的核心素养框架来看,大部分核心素养都是包含知识、技能、态度与价值的高阶能力,对于这类结构复杂、高度抽象的高阶技能,传统的教育测量理念、技术、方法面临极大的困难。当前,国际教育测量界在ECD评价设计理论的指导下,致力于发展基于技术的高阶技能测评方法,以此回应核
基于全球范围对核心素养体系的研究及我国大陆地区课程改革的不断推进,如何提高学生问题解决能力,促进学生创新发展,是目前开展关键能力实证研究的重要目的。而数学问题解决作为一种高级认知能力,开展对其能力测评和课程教学的研究就显得尤为必要。它是指事先不知道解决方法的数学任务求解过程。本研究基于核心素养框架,以问题解决能力为切入点,借鉴PISA等国际研究框架建构基础评价模型,开发多元化测评工具,采用科学统计
认知诊断由于其目标在于诊断学生对一组可独立界定的技能或属性的掌握状态,能为学生提供关于他们具体的优势与不足的详尽信息,因而成为心理测量研究领域的新的兴奋点。本研究以初中数学一元二次方程求解的认知诊断为例,旨在探讨如下三个问题:(1)构建“使用配方法和公式法求解一元二次方程”的认知模型;(2)验证认知诊断反馈能否显著提升实验班学生的后测成绩;(3)调查将认知诊断应用于初中数学学业评价的可行性与局限性
目前我国高考和中考大型测试物理学科试题功能的测评,停留在对试卷题型结构、内容结构和能力结构方面分析,缺少对学生认知维度分析。本文采用结构方程模型(SEM)方法,对2012年大连市中考物理测试数据进行探索性(EFA)和验证性因子分析(CFA),得到了影响测试题目的三类因子(F1、F2、F3)、因子所包含的题目和模型结构。根据对试题定性分析得到三个因子分别应为记忆、理解与简单应用、问题解决,与国际科学
中考作为大规模、高利害考试,试卷质量的科学性和公平性,不仅直接影响到考生的切身利益,而且也影响到考试的权威性。现阶段国内对试卷的评价主要是基于经典测量理论,对试卷的内容效度、信度及试题的难度、区分度进行分析。本研究在以往研究的基础上,增加对试卷预测效度的考察,并对项目功能差异(DIF)进行检验。本研究以广州市2015年中考思想品德(简称“思品”)试卷为例,旨在探讨如下两个问题:(1)考察试卷的内容
在2012年,1953名15岁的上海初中九年级孩子,既参加的上海初中毕业统一学业考试(简称中考)数学科目的测评,又参加了PISA数学笔试的测评.本论文得到上述两个数学测评成绩的相关性为0.71,同时利用回归分析,分析了PISA数学测评成绩、两个测评在测评框架内容及过程领域上的差异对中考数学成绩离散程度的解释率.本论文得到PISA数学成绩,对上海初三15岁群体的中考数学成绩差异的解释率只有51%,两
随着云技术、大数据技术在教育领域的广泛云用,考试数据已成为教育评价的重要依据。有效利用考试数据对学生学业状况进行分析,全面客观地评价学生的学业状况。考试数据是检验教师教学情况的量化指标,更是指导教师教学的重要依据。目前,教育部门以及学校老师对考试数据本身所提供的信息挖掘不够,只看到了考试成绩的平均分,及格率和优秀率,反馈给学生的也只是各科的总分或每小题的得分情况,而没有进行更深层次的分析。
中国是考试大国,然而泄题、替考、抄袭等恶性作弊事件层出不穷。显然,依靠考前的防范措施不能有效杜绝,应引入统计手段进行试后甄别。现有的利用统计手段进行作弊甄别的方法可归结为两类,答案抄袭(AnswerCopying)检测法和个人拟合(Person-Fit)检测法。相比于个人拟合检测法,答案抄袭检测法所对应的理论假设与答案抄袭直接相关,且有更高的检出率,在作弊甄别领域有着更为广泛的应用。但是,答案抄袭
认知诊断是新一代教育测验理论的核心部分。认知诊断测验要实现认知诊断功能,离不开认知诊断模型,据统计,到目前为止,已开发了近百种认知诊断模型,每种认知诊断模型都有其适用范围,且各有其优缺点。广义距离判别法(GDD)(孙佳楠、张淑梅、辛涛和包钰,2011)的本质是利用项目反应理论(IRT)下两参数逻辑斯蒂克模型(2PLM)的项目特征函数对观察反应模式(ORP)与理想反应模式(IRP)之间的海明距离进行
信度是评价测验结果稳定性、一致性的重要指标,基于认知诊断测验结果是将被试分类的特点,有学者将标准参照测验的基于列联表的信度指标引入到认知诊断当中,开发出认知诊断的属性信度指标,主要有Templin的属性重测一致性和Wang的属性分类一致性。以DINA模型为例,对Templin的属性重测一致性指标和Wang的属性分类一致性指标进行改进,比较改进前后的属性信度指标的性能,并且将标准参照测验中基于列联表