论文部分内容阅读
选题策略使认知诊断计算机化自适应测验(cognitive diagnostic computerized adaptive testing,CD-CAT)具有动态和自适应的特征,是CD-CAT的重要组成部分。尽管CD-CAT中二级评分项目选题策略受到广泛关注,对多级评分项目选题策略的研究还非常少。本文针对多级评分数据开展了三项研究。首先,研究一中,针对属性平衡问题,一方面提出了两种基于多级评分PWKL(简记为PSPWKL)改进的选题策略,简记为VPWKL和VSPWKL。另一方面,将属性水平的区分度指标(简记为ADI)加权,提出了四种多级评分的区分度指标,简记为SADI、VSADI、SADIKL和SADIPWKL。同时,将现有的二级评分AIDPWKL推广至多级评分的ADIPWKL。其次,本文通过R(3.6.2版)生成实验数据开展了两项模拟研究。研究二基于局部或相邻类别链接函数的多级评分DINA模型(简记为LC-DINA)生成项目库,开展长度为15、20、25三种条件的模拟实验,比较新提出的选题策略与现有的多级评分KL选题策略(简记为PSKL)和PSPWKL间属性判准率和题库安全性的差异。研究结果表明:(1)整体上,基于PSPWKL改进的多级评分选题策略比基于区分度加权的选题策略表现更好;(2)VSPWKL和VPWKL的属性判准率比PSPWKL高;(3)SADI的判准率比PSKL稍好,而VSADI、SADIKL、SADIPWKL和ADIPWKL比SADI更能提高测验判准率;(4)项目使用方面,7种选题策略都不及PSPWKL均匀。研究三使用VPWKL、VSPWKL和PSPWKL,探索混合测验中不同施测顺序和施测比例对测验的影响。其中,施测顺序设置为:顺序A(先施测完所有多级评分项目再施测二级评分项目)、顺序B(所有多级评分项目位于中间施测,前后部分各施测一半二级评分项目)、顺序C(先施测完所有二级评分项目,再施测多级评分项目)和顺序D(随机施测多级评分项目)。鉴于实际测验中多级评分项目占60%的情况,本研究将施测比例设置为多级评分项目与二级评分项目的比例为2:3和3:2两种情况。研究结果表明:(1)当测验中“先施测完所有二级评分项目,再施测多级评分项目”时,测验准确性相对较低且项目使用较不均匀。但并没有统一的施测顺序能保证不同选题策略都具有较高的判准率;(2)测验采用“先施测完所有多级评分项目再施测二级评分项目”的顺序,项目使用均匀性最好;(3)当多级评分项目与二级评分项目的施测比例为3:2时,其测验准确性比施测比例为2:3更高。