三种常用英语测试题及其优劣性

来源 :考试周刊 | 被引量 : 0次 | 上传用户:Michaelyfj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘 要: 本文主要从命题原则、题型结构、评分标准和评分办法等方面分别对外语测试中常用的三种题型,即多项选择题、完型填空、写作题进行分析比较,旨在提高这些测试题的信度和效度。
  关键词: 英语测试题 优劣性 信度和效度
  
  作为语言教师,我们几乎天天和测试打交道。比如说,每次讲授新课之前,可能抽出几分钟的时间复习一下上一课学过的知识,或做单词拼写,或做短文听写等。每教完一课,可能要进行一次测验,检查一下学生对本课掌握的情况。到学期中间,一般进行期中考试,期末还要进行期末考试,等等。在这样的一个教学过程中,我们不仅可以看到学生的学习及进步情况,同时还可以了解到自己的教学效果。因此,教学离不开测试。现代教育理论的发展,尤其注重人的素质的教育,强调发挥学生的主观能动性,强调因材施教。要检验教学的效果,离不开对学生的评价,通俗地讲,就是对学生进行测试。那么,为了正确地、更好地、更有效地运用测试手段来检查学生的成绩及评价教师的教学效果,笔者从命题原则、题型结构、评分标准和评分方法等方面分别对外语测试中常用的三种题型,即多项选择题、完型填空、写作题进行分析比较,并对这三种测试题的优劣性进行了论述。
  
  一、多项选择题(multiple choice item)
  
  多项选择题命题的出发点是提高测试效度。
  各类试题的命题都应为测试目的服务,以提高测试效度为前提。在多项选择题的命题中,经常会由于过多地考虑选择项而忽略其他问题。例如,在学生还没有学过San Francisco这个词时,就要求学生做下面的练习:
  San Francisco is________the west of the United States.
  A.onB.toC.inD.at
  这道题命题的本意是测试学生对英语常用介词in和to在表示方位时用法上的区别,但是如果学生不知道San Francisco 是一个国家名还是美国国内一个地名,他们就无法作出判断,也很难找到正确答案。像这样的试题根本无法达到测试介词的目的。
  1.多项选择题的命题原则
  (1)多项选择题对题干和选择项的要求
  命题时要注意题干必须有一定的内容,不能仅是一两个词,题干内容提供的信息应有效地将考生带入测试点范围之中。选择项中共同的语言应该放在题干中,避免每个选项里重复出现。同时,选项的内容和语言应平行、对等,应属于同种类型(如同为单词、短语或者从句)。正确答案的长度应与其他选项大致相同,太长或太短都会对考生有暗示之嫌。例如:
  The passage tells us________.
  A.different waysB.teaching approach
  C.educational systems D.different ways of learning in China
  上题中,由于D项内容丰富,有一定的长度,考生很容易通过比较选出正确答案项。此外,选项还要避免生词形、搭配、词序等的出现。例如:
  He stood up and it.
  A.objected to doB.objected to doing
  C.be objected to doD.be objected to doing
  上例中A、C、D三个选择可能是生造的结构。这样的错误信息可能成为误导学生的语言输入,使他们形成错误假设,妨碍以后的学习。这种试题效度差,达不到测试目的。
  (2)命题要紧扣阅读或听力材料内容
  在阅读和听力测试的多项选择题中,试题答案必须紧扣材料内容,使考生只有在读懂或听懂之后才能作出正确选择,而不能凭自己的经验和常识甚至记忆就能猜对答案。因为选择题本身就包含有猜测因素,如果测试内容不紧扣阅读或听力材料,就很难保证测试效度。
  2.多项选择题的优劣性
  多项选择题的优点在于:首先,它只有一个正确答案,是一种客观性试题,评分省时省力,因此,无需考虑评分者的因素,可把精力集中在提高命题质量上。其次,使用该题型能够控制试题的难度,并能通过测试等手段筛选试题,使正式考试更具可行性和科学性。再者,多项选择题题义清晰,考生不会产生误解,考生无须书面表达而不受其写作能力的影响。另外,它对考生在英语语法、词汇的理解、分析等方面内容的考查信息量大,覆盖面宽,形式灵活多样,而且这种题型对于考生答题省时,因此可以增加考试的覆盖面和采样量,提高考试的信度。
  然而,多项选择题也存在弊病,不能滥用该题型。因为,1.多项选择题只能显示正确或错误答案,它只考语言知识的识别,不能测量语言的运用和产出能力,更不能排除猜测因素,考生可以靠猜测答题。而且多项选择题最容易靠旁窥和打暗号等方式作弊,因此,测试结果的效度会打折扣。2.命题难。它的命题需要命题者花费大量的时间和精力反复推敲,稍有不慎就会问题很多。3.反拨效应差,容易使师生片面追求应试技巧而忽视语言训练本身。
  
  二、完形填空测试题(cloze test)
  
  1.完形填空题的命题原则
  完形填空测试(cloze test)是指所选的一段文章中有意地把每隔5—7个左右的单词删除掉,要求学生根据前后所提供的信息推测空缺中的意义并据此填上正确的词,使之复原意义完整、结构正确的短文,以测试考生综合运用语言的能力。该题型对命题的基本要求是:
  该题往往是一篇或一段文章,段落的开头和结尾的那个句子总是完整的,不留任何一个空格,这样,为考生提供了更为完整和充分的语境。整题必须有一定的长度和适当的空格数,只有这样才能使考生正确理解题意,不致误导,才能达到测试信度的要求。
  完形填空题的留空形式有两种:一是定词留空,大约每隔5—11个词留一个空,词与词间隔的距离越短,难度越大,一般以7—9个词的词距为宜。二是不定留空。根据测试要求,需要测试什么内容就把该位置留空,例如测试习惯搭配、介词用法、时态或语态的变化等都可以在这些地方留空。
  2.完形填空题的三种评分办法
  (1)确切词评分法(exact-word method)
  确切词评分法是指考生在空缺处填写的词正确与否要根据它所删除的词是否一致。这种评分既简单又客观。但是,由于很少有考生能够填出与原文完全相同的词语,这种评分方法使完形填空题加大了难度,降低了测试的区分度,故现在很少使用这一测试方法。
  (2)可接受词评分法(acceptable-word method)
  可接受词评分法是学生在空缺处所填写的词并不强求与原文完全相同,只要在结构上、语义上正确就可视为正确的答案。这样做的好处是降低了难度,提高了成绩,而且从考生多种多样的答案中教师还能发现教学的不足。但使用这种方法评分可能产生分歧意见,因而可能会降低评分的客观性。因此它不适用于大规模的标准化测试。
  (3)多项选择评分法(multiple-choice method)
  多项选择评分法是严格的完形测试作适当的修正,把由学生在空缺处填入正确的词改为向学生提供备选项,供他们选择。这种形式的试题评分较客观,命题较科学,信度和效度都达到要求,是目前各类测试中完形填空题最常用的一种形式。
  3.完形填空题的优劣性
  完形填空的优点在于:1.完形填空题具有测试考生综合运用语言能力的优势。例如目前广为流行的CET,DETS,IELTS(雅思)等都有这类题型。考生在做这类题型时,需要运用英语语言的各种知识和能力,除了熟练运用语法、词汇等知识以外,还必须具有很强的概括、分析、推断等能力,只有这样才能保证答案的准确性。2.完形填空题命题省时,是一种比较经济的测试手段。它的命题无需像多项选择题那样,每一个题都要仔细斟酌,花费大量的时间和精力。
  与此同时,完形填空题也不可避免地存在一定的局限性,集中体现在以下三个方面:1.不能敏感地测定学生在低年级学习英语所取得的效果,也就是说,完形填空测试题在低年级似乎不能发挥其本身的优势。2.采用可接受词评分似乎在某种程度上能更好地了解被试者的英语运用水平,然而,对于在非英语国家这一环境里教授英语,命题方面受到客观因素的制约。3.严格的完形填空题,每隔5—8个单词删除一词,留一空格,可能有时遇上一些地名、人名或其他常识性或对学生来说较难猜测的词,这就可能提高试题难度,从而降低了考试的信度和效度,以及试题的区分度。
  
  三、写作测试(writing test)
  
  1.写作的命题原则
  写作是大学英语教学中的一个重要组成部分。纵观各类综合英语教科书,写作必定是其中一项重要内容。同样,写作测试在考试中也是一个不可少的项目,在综合能力考卷中。人们予以写作的高度重视体现了写作能力在实际语言交流中的重要作用。
  能够正确拼写英语单词及运用标点符号不等于会写完整的句子;会写完整的句子不等于会写通顺连贯的文章;但会写通顺连贯文章的人必须具备以上拼写、词汇和语法知识。
  大学英语写作能力实际上还涵盖了其他一些因素——内容条理性、文体恰当性、修辞知识等。
  写作测试是一种高效度的语言测试手段,我们应该发挥其最大的效度优势。要做到这一点,在设计写作试题时,应注意下面几条原则:
  第一,写作试题要有真实的情景,也就是考生现在或将来很有可能会遇到的情景。这条原则称作真实性原则。设计写作试题要遵循这条原则。因为只有试题的情景真实,才能测试我们所期望学生应掌握的写作技能。
  第二,写作试题要保证以意义为测试焦点,而非语言形式。
  第三,试题的要求应该是互动性行为。在现实生活中,人们使用语言来进行交际时,是一个交互性的、动态的过程。写作同样也是一种交互性的行为,因为写出来的东西是让读者看的。这就意味着设计写作试题时,需要考虑到互动性这一特征。
  2.写作测试题的两种评分法
  (1)整体(或印象)评分法(holistic/impression scoring)
  整体评分法把作文视作一个完整的篇章,根据其总体印象打分,所以有时被称为印象评分法。问卷人员就总的印象给出奖励分,而不是按语言点的错误数目扣分。
  整体评分法把所阅作文分成几个档次(band),每个档次与一个分数或分数段相对应。每个档次还必须明确该档次作文的特征,比如内容、语法、组织、表达等,同时档次之间应显示明显区别。阅卷人员注重的是作文的整体质量,而不是局部现象的特征,比如作文主题扩展和例证是否充分,论证是否有力;作文风格是否符合阅读对象的层次和背景,等等。
  (2)分析评分法(analysis scoring)
  分析评分法认为作文是由不同的成分(components)组成,如语法、内容、组织、表达和连贯等。分析评分法根据不同成分给作文分别打分,最终分数由各个小分相加而成。
  分析评分法有以下特点:1.使问卷人员明确具体评分方面。2.组成部分之间的评分不互相干扰或影响。由于一个人各种具体写作技能的发展常常是不平衡的,因此很难用一种固定模式来衡量。分析评分法可以针对每项技能或每个方面单独打分,从而避免出现整体评分法所面临跨档次的难题。
  但是,分析评分法存在的第一个问题是把写作能力人为地分割成互不关联的部分。写作能力的体现事实上不仅仅是按照规范把句子联在一起,它还涉及其他方面,如文体、风格,这些都需要从文章总体上观察和评判。把各个部分分离出来会导致阅卷人员过多地关注作文的局部性而忽略其全局性。分析评分法的第二个问题起源于第一个问题。写作能力划成单独部分后就涉及分值分配,即某个部分占总分的比例。换句话说,比例如何分配牵涉到考试的结构效度,即考分的解释功能。如果在写作总分中语言分的比例过高,写作分数实际上反映的是语言知识,不是写作能力。因此,我们在使用分析评分法时要力求做到重点明确、分值合理,较高的分值比例应给那些较能体现或代表写作能力的部分。
  3.写作测试的优劣性
  写作测试的最大优点是效度高。第一,写作测试是一门综合性测试,它不仅能考查学生的输出性技能(productive skill),同时还能考查学生的接收性技能(receptive skill)。第二,它能同时测试语言的各个层次和范畴。它可以测试学生的组织能力、分析能力、表达能力、逻辑推理、对各种语体的掌握等。写作测试作为一种行为测试,测量的是学生实际运用语言的能力,给教学带来的是非常积极的正面反拨作用。
  写作测试的弱点是信度低。写作测试属于主观测试,主观测试的评分无法客观化。比如对一篇作文的评分,10位评分员可能给出10个不同的分数。有时同一位评分员也无法做到评分标准始终如一。评分无法客观化,测试信度难以保证。
  综上所述,笔者从命题原则、评分标准、操作进程诸方面对这三种常见题型(多项选择、完形填空、写作测试)的命题进行了尽可能客观的论述,并指出其优劣性。目的是让英语考试命题者在运用以上题型时扬长避短,以便更好地考查出英语学习者真实的英语水平。
  
  参考文献:
  [1]刘润清,韩宝成.语言测试和它的方法.外语教学与研究出版社,1999.
  [2]邹申,杨任明.简明英语测试教程.高等教育出版社,2000.
  [3]Bachman,L.F.Fundamental Considerations in Language Testing.Oxford University Press,1991.
其他文献
从1871年第一张日本报纸《横滨每日新闻》创刊至今,日本报业已经历了近120年的历史进程。随着经济的迅速发展,日本报纸也随之发生了巨大变化。今天,日本每天出版发行7000万
摘 要: 本文叙述了噪声的基本概念和电动机噪声对人体健康的危害。根据声学原理,着重分析了电动机的噪声来源及降噪方法。以噪声源控制、传播途径控制和保护接收者为途径,介绍了降低电动机噪声级的辅助措施。  关键词: 电动机噪声 主要降噪措施 辅助措施    1.噪声是危害人类健康的杀手之一  凡是使人烦恼的、破坏安静的,影响人们正常生活、工作、学习的声音,不管是乐音还是其他声音,都称之为噪声。科学研究表
初中阶段是化学教育的启蒙阶段和基础阶段,搞好初中化学教育工作不仅能够为高中阶段的化学学习打下坚实的基础,而且学生在学习化学的过程中能够逐步形成一定的化学素养,以及解决实际生活中遇到的问题的能力。新课程改革不断深入发展,对化学教学工作也提出了一些新的要求,为此,在化学教学中实现有效教学就成为了每一个化学教师都应当重视的问题。  一、有效教学的涵义  关于有效教学的概念,最早出现于英文教育的文献之中。
一、盲目引种 贪便宜、图省事,就近购买私人经营的未经检疫的种子,结果往往贪小便宜吃大亏。 二、管理技术跟不上 优良品种不仅要有适宜自己生长的土壤、气候等自然条件,还
猪细小病毒(Porcine Parvovirus,PPV)自二十世纪六十年代被发现以来,许多国家先后分离到该病毒和检测到其抗体,抗体检出率为50%-80%,其中我国高达80%。该病毒感染能引起以母
玉米缺粒秃顶的原因很多,主要有以下四个方面:一是受高温伏旱的影响,玉米在生长后期,极易遇到伏旱,对授粉结实不利,群众叫做“卡脖子”,缩短了开花散粉时间,使尖上的籽烂不
摘 要: 合作学习是一种责任分工学习,本文对合作学习模式在医学细胞生物学课程中的应用进行了分析。  关键词: 合作学习教学模式 医学细胞生物学 应用    合作学习(cooperative learning)是一种以小组学习为形式,旨在促进学生合作,从而达到最佳学习效果的教学方法。它能改善课堂气氛,大面积提高学生的学业成绩,并且能满足学生的心理需要,促进学生情感的发展,已经广泛地受到世界各国的青睐
头孢喹肟(cefquinome,CEF)是动物专用的第一个第四代头孢菌素,具有抗菌谱广、抗菌活性强,吸收迅速,安全,高效等特点,临床上取得了良好的效果,在我国兽医临床上具有广阔的应用前
摘要: 目前的计算机公共课考试存在很多问题,如果不进行考试改革,将严重影响到考试功能的发挥和计算机公共课教学水平的提高,以及人才培养目标的实现。本文对计算机公共课考试改革进行了思考,分析了传统考试模式的弊端,提出了考试改革应当注意的几个方面。  关键词: 高职教育 计算机公共课 考试改革    在教学各环节中,考试是教学过程的一个重要环节,一方面可以对学生的学习情况有个定量、定性的评价,另一方面可
农业要实现粮增产、钱增收,除大力推广作物优良品种外,还应有一套趋向合理立体种植方式和科学管理方法,要做到在不影响粮食生产的前提下积极发展经济作物,使土地粮经作物有