核等值与其它等值方法的比较研究

来源 :北京语言大学 | 被引量 : 3次 | 上传用户:sdliule
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
标准化测验也称标准化考试,是今天的主流考试模式,它一般分为四个步骤:命题、施测、评分和分数解释。为了解释考试分数,就需要建立分数的参照系,就需要保持分数之间的可比性。等值是使各试卷分数具有可比性的一个统计过程,是保证考试公平性和维护考试声誉的重要环节,也是实现计算机自适应考试的关键步骤。1980年,等值的重要作用引起关注,心理测量者们开始对其进行相关研究,在经典测验理论下,先后研发出了线形等值、等百分位等值等方法。核等值是一种较新的、系统性较强的等值方法。它是建立在等百分位等值基础上的、对观察分数进行等值的一种方法,它比等百分位等值更优的地方就是对数据运用一些特定的数学方法进行平滑处理,从而减小误差,并可以对等值误差进行计算。把核等值与其他等值方法进行比较的研究主要是一种验证性质的研究,本文以1997年HSK(中国汉语水平考试)初中等考试一次共同组等值结果作为效标,在共同题设计中,通过比较线性方法、等百分位方法和核等值方法的等值结果,来分析各自优劣,并着重对核等值这种方法的等值效果进行研究。在进行作为效标的共同组等值时,本文采用了2种方法,一种是线性等值,另一种是核等值。结果表明:共同组中以核等值结果为效标时,共同题设计中核等值的效果最好,等百分位效果最差。而共同组中以线性等值结果为效标时,共同题设计中线性等值的效果最好,等百分位效果仍然最差。HSK初中等考试包括4个分测验,分别是听力、语法、阅读和综合。就分测验而言,以共同组核等值结果为效标时,线性等值和核等值的等值效果相差不大,相差最大的是阅读部分,误差也仅为.16。而以共同组线性等值结果为效标时,在听力和语法部分,线性方法与核等值的结果相差不大,误差控制在.1左右,在阅读和综合部分,两者的误差相对大一点,最高达1.3。本文对研究结果进行了讨论,并通过匹配组T检验的方法对小样本核等值结果进行统计,以此来检验核等值对样本的依赖程度。
其他文献
中职物理力学教育在实际的物理课程中属于基础性课程,这对于中职学校基础知识的教学较为重要。合理化的中职学生的物理课程学习有利于加强学生在整体学习能力中的合理化培养,
<正>法制新闻是对新近发生的与法制相关的有新闻价值的事实的报道。近年来,随着社会主义市场经济的快速发展,法律在人们日常生活中的地位和作用日益凸现,人民群众的法律意识
伴随着我国经济建设节奏的持续加速,发展过程中的资源与环境之间的问题与矛盾也不断突出。在这种情况下,国家制定并出台了包括《循环经济促进法》在内的诸多法律来实现对经济
截至2007年,深圳一水库实际渗漏量是设计渗漏量的10倍,渗流情况非常复杂。为找出渗漏量偏大的原因并确定渗漏通道的位置,运用综合分析法研究坝体的渗流情况。首先采用示踪法
目的研究IL-6、TNF-α、MMP-8在未足月胎膜早破早产孕妇的血清、羊水中的含量,探讨其与胎膜早破早产及宫内感染的关系。方法采用酶联免疫吸附法检测40例胎膜早破早产孕妇(PPR
本文研究的是《论衡》一书中的疑问句。文章在三个理论的指导下,广泛借鉴并吸收了古今汉语疑问句的研究成果,以语法形式与语法意义的关系为纲,从句法结构、语义内容以及语用
电子罗盘是一种利用地磁场来测量方位的传感器。随着科技的发展,它的应用领域在不断的扩大,在我们的国防建设、工业生产、日常生活中起着越来越重要的作用。但是由于种种原因,我
<正> 春秋战国是中国社会从奴隶制向封建制轉化的过渡时期。在这个时期,新的地主阶級有两个来源。一部分的地主阶級是从奴隶主貴族轉化来的;一部分是由商人、小生产者轉化来
本文以现代汉语常用的时间连词“继而”为研究对象,通过全面考察语料,描写“继而”词汇化的过程,明确它的成词时间,同时对其词汇化的动因和机制进行了分析。第一章绪论。指出
<正>多年的教学实践,使我更深切地感受到课堂提问是优化课堂教学的重要手段之一,而开放式的提问更有助于提高课堂教学效果.