两种多组DIF检测方法的比较研究

来源 :浙江师范大学 | 被引量 : 0次 | 上传用户:destinyjack1983
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
项目功能差异(DIF)分析作为确保测验公平的环节中非常重要的一环,受到了国际上的大量关注。但是目前对于DIF的研究主要集中于研究适用于检测两个群体间的DIF效应的方法之上,而随着大型国际评估项目的兴起与盛行,如PISA, TIMSS等,对能够检测多个群体间DIF效应的方法的需求也随之增大了。而目前针对于多组DIF方法的研究较少,且不够深入,。在经过文献分析后发现,还未有多组DIF检测方法:GLR和GLord卡方方法的模拟比较研究,因此本研究将研究对象确定为这两种方法。本研究在对DIF的相关概念及两组DIF方法进行简要介绍后,回顾了多组DIF检测方法的发展过程,然后介绍了GLR和GLord卡方方法的模型与公式。本研究的实验共包括三个:研究一作为预实验,简单比较了GLR和GLord卡方方法及各自对应的两组方法(LR、BLR、Lord卡方、BLord卡方)在多组条件下的检测情况,研究结果发现两组DIF方法(LR和Lord)的Ⅰ型错误膨胀幅度太大,而Bonferroni校正后的BLR和BLord卡方则检出率太低,两类方法无论在控制Ⅰ型错误率上还是检出率上,都不如多组方法(GLR和GLord卡方)的结果,因此在多组DIF检测时推荐使用多组方法;研究二是本研究的重点,探索GLR和GLord卡方方法的DIF检测情况。研究发现,两种方法的Ⅰ型错误率都随样本量的增加而下降,随DIF组数量的增加而升高。在能力分布不等时,两种方法出现了不同程度的Ⅰ型错误膨胀,GLR膨胀的程度更大;而检出率在能力分布相等和不等时的变化趋势是一致的,都随着样本量的增加而升高,随着DIF题目比例和DIF组数量的增加而呈现先上升后下降的趋势;研究三则选用PISA2009阅读素养中的部分数据(4个国家在29个题目上的作答数据)比较了GLR和GLord卡方方法的DIF检测情况。检测结果发现,两种方法检测出的含有DIF的题目及比例是相同的,测验中检测出含有DIF的题目比例较大。
其他文献
1995年10月在北京召开的全国男篮甲级联赛会议上,中国篮协推出了《中国篮球协会运动员转队暂行条例》和《俱乐部暂行管理条例》,拉开了我国篮球职业化改革的序幕。这在中国社
幼儿阶段是个体身心发展的重要时期,在这个阶段的养成教育奠定了个体身心健康发展的重要基础。在我国大多数的家庭中,母亲作为幼儿阶段的主要养育者,在整个幼儿发展的过程中
群众体育作为我国体育事业的重要组成部分,它关系到人们体质的增强,健康水平的提高和生活质量的改善,是现代社会文明进步的重要标志。伴随着改革开放的不断深入,经济和社会的发展
1983年,加德纳教授提出了多元智能理论,在美国和世界很多国家的教育工作者中引起了强烈反响,受到了广泛的好评。近几年来,多元智能理论也受到了我国教育界的普遍关注,因为它
本文是以学校场域中学生话语的文化生态为主题开展的研究。本研究以文化生态学的理论为背景,认为在学校文化生态这一小系统中理应保持文化生态系统的和谐、平衡,只有和谐平衡的