认知诊断CAT中多级评分项目选题策略的研究

来源 :四川师范大学 | 被引量 : 0次 | 上传用户:cdauto
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
选题策略使认知诊断计算机化自适应测验(cognitive diagnostic computerized adaptive testing,CD-CAT)具有动态和自适应的特征,是CD-CAT的重要组成部分。尽管CD-CAT中二级评分项目选题策略受到广泛关注,对多级评分项目选题策略的研究还非常少。本文针对多级评分数据开展了三项研究。首先,研究一中,针对属性平衡问题,一方面提出了两种基于多级评分PWKL(简记为PSPWKL)改进的选题策略,简记为VPWKL和VSPWKL。另一方面,将属性水平的区分度指标(简记为ADI)加权,提出了四种多级评分的区分度指标,简记为SADI、VSADI、SADIKL和SADIPWKL。同时,将现有的二级评分AIDPWKL推广至多级评分的ADIPWKL。其次,本文通过R(3.6.2版)生成实验数据开展了两项模拟研究。研究二基于局部或相邻类别链接函数的多级评分DINA模型(简记为LC-DINA)生成项目库,开展长度为15、20、25三种条件的模拟实验,比较新提出的选题策略与现有的多级评分KL选题策略(简记为PSKL)和PSPWKL间属性判准率和题库安全性的差异。研究结果表明:(1)整体上,基于PSPWKL改进的多级评分选题策略比基于区分度加权的选题策略表现更好;(2)VSPWKL和VPWKL的属性判准率比PSPWKL高;(3)SADI的判准率比PSKL稍好,而VSADI、SADIKL、SADIPWKL和ADIPWKL比SADI更能提高测验判准率;(4)项目使用方面,7种选题策略都不及PSPWKL均匀。研究三使用VPWKL、VSPWKL和PSPWKL,探索混合测验中不同施测顺序和施测比例对测验的影响。其中,施测顺序设置为:顺序A(先施测完所有多级评分项目再施测二级评分项目)、顺序B(所有多级评分项目位于中间施测,前后部分各施测一半二级评分项目)、顺序C(先施测完所有二级评分项目,再施测多级评分项目)和顺序D(随机施测多级评分项目)。鉴于实际测验中多级评分项目占60%的情况,本研究将施测比例设置为多级评分项目与二级评分项目的比例为2:3和3:2两种情况。研究结果表明:(1)当测验中“先施测完所有二级评分项目,再施测多级评分项目”时,测验准确性相对较低且项目使用较不均匀。但并没有统一的施测顺序能保证不同选题策略都具有较高的判准率;(2)测验采用“先施测完所有多级评分项目再施测二级评分项目”的顺序,项目使用均匀性最好;(3)当多级评分项目与二级评分项目的施测比例为3:2时,其测验准确性比施测比例为2:3更高。
其他文献
师德师风不仅体现了教师的职业道德和教学学风,而且直接关系到学校的办学方向和人才培养目标。目前,高校青年教师的总体情况是好的,但在市场经济浪潮的冲击下,部分高校教师出现了
目的:观察Ca SR在糖尿病性勃起功能障碍(Diabetes mellitus-induced erectile dysfunction,DMED)大鼠阴茎海绵体平滑肌内的表达,揭示其与勃起功能障碍的关系。方法:3月龄雄性
目的:探讨胫骨平台骨折内固定术后患者康复中应用系统功能康复治疗的效果。方法:择取我院2015-01~2017-01收治的118例胫骨平台骨折患者,随机分为观察组和对照组,对照组患者采
针对四川省耕地生态安全状况,以四川省21个市(州)为研究对象,构建基于压力-状态-响应(pressurestate-response,简称PSR)模型的耕地生态安全评价指标体系,综合运用地理信息系