语言能力测试的取向考察与分析

来源 :现代语文(语言研究) | 被引量 : 0次 | 上传用户:mcdonaldz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘 要:本文结合语言学理论等研究领域的成果,对语言能力测试取向发展过程进行了梳理,得出语言能力测试取向经过了前科学阶段、心理测量—结构主义阶段、心理语言学—社会语言学阶段及交际能力四个阶段。测试语言能力的方法之间不应是替代关系,而是互补关系,因为各种取向自有其适用范围,语言能力测试的开发要兼容各种能力取向。
  关键词:语言能力 语言测试 测试取向 语言观
  
  语言能力测试是语言教学过程中不可缺少的环节,虽然早在几百年前就有了外语考试,但是语言能力或水平评估的科学化、专业化却是近几十年的事情。近年来,国外语言能力测试更是呈现出多样化的发展趋势。这些新变化都与语言学研究中人们对于什么是语言、什么是语言能力、外语如何习得等基本问题的理解有着密切的关系。本文拟结合语言学研究领域中的发展,考察语言能力测试取向的发展,为语言能力测试开发提供参考。
  早在1978年,B.Spolsky就提出语言能力测试的发展可以划分为三个阶段。他的观点在国外语言测试界得到了广泛认可。这三个阶段分别是科学前阶段(pre-scientific period)(大约至20世纪50年代初期),心理测量——结构主义阶段(psychometric-structralist period)(50年代初~70年代初),心理语言学——社会语言学阶段(integrative-sociolinguistic period)(约始于70年代中期)。到80年代又出现了一种交际测试法。这些时间界线实际上并非泾渭分明,相反,各阶段之间相互重叠,也就是说,虽然每一个阶段都有一种测试指导思想占主导地位,但同时也有多种体现其它测试观点的测试手段共存。
  
  一、前科学阶段
  
  在这个阶段,语言教师对于什么是语言能力这个最基本的问题没有科学的认识,只是把语言能力当作一门包括语法知识、词法知识、语音知识的知识体系去讲授。把语言看作一套知识,是这个阶段语言教学和测试体系的语言观的内涵(刘润清、韩宝成,2000)。测试中对技巧、技能的考查没有量度依据,测试结果主要根据教师的主观判断(Heaton,1988)。在这一阶段,外语教师在教学中采用的是语法翻译法(grammar translation approach)。与此相适应的测试方的主要特点是:
  (一)测试内容:重视语法规则、词形变化和词语的用法;
  (二)测试形式:重视书面用语,一般只采取笔试;听力、口语被认为是额外的,绝不是大纲或测试的组成部分;
  (三)题型:以主观题为主,如文章翻译、作文、语法分析、回答问题等;
  (四)命题过程:一般由任课教师独自命题,没有统一的测试指导思想;
  (五)评分方法:一般由任课教师评分,没有统一的评分标准;
  (六)测试评价:忽视对测试成绩的分析与评估。
  虽然这一阶段的测试和评分方法有不少可取之处,如作文、回答问题等试题一直沿用至今,但整个语言能力测试既没有科学的语言理论做指导,也没有统一的客观评估标准,测试结果完全凭考官的经验和主观判断来决定。因此测试的效度和信度都不理想,可以说前科学测试既缺乏科学性又缺乏系统性,是测试发展的雏形时期。
  
  二、心理测量——结构主义阶段
  
  到了20世纪40年代,人们发现关于语言规则知识的学习并不等于语言学习。以Bloomfield为首的美国结构主义语言学家第一次提出:语言是一套形式结构,是由众多次系统组成的任意符号系统,这套符号系统可以分解为语音、词汇、语法等单位。以Skinner为首的美国行为主义心理学家认为:语言行为是一连串的刺激-反应过程。因而,掌握语言就是要获得操作这套符号系统的技能,是在有刺激(stimulus)存在的条件下,通过反复练习、强化训练,从而形成语言习惯。这种语言习惯同样也可被分解成音位学、词汇学、句法学等层次上的语言习惯,各层次的语言习惯又可以根据听、说、读、写这些不同的技能来进行划分。
  结构主义语言分析为测试提供了内容基础和一种可行的方法,而心理测试及其相关的统计方法则为出题提供了有效的工具。心理测试法受语言测试者欢迎的原因主要有两个:一是题目多为“闭合型”,答案是限定的,所以能客观打分;二是一套现成的统计学数据分析方法和标准可供利用。
  测试专家们认为,既然掌握一门语言意味着掌握单项语言要素知识和听、说、读、写这些使用上述知识的模式,那么把语言按照这四种技能分离开,每一技能再进一步被分离成不同的语法层次部分,然后一个一个地分开考核这些不同的组成部分,最后把受试者各方面的考试结果加在一起,就达到了对受试者语言能力的全面评估。这就是分离式测试法(discrete point testing approach)。
  由于分离式测试比较容易做到教育测量学所要求的准确与客观,美国语言学家Lado把二者吸收、融合在一起,创立了科学的现代外语测试理论。他的测试学巨著《语言测试:外语测试的结构和使用》(Language Testing:The Construction and Use of Foreign Language Test)详尽阐述了分离式测试法的特点:
  1.把信度和效度作为评价外语测试的基本标准;
  2.测试可按语言结构层次由低到高进行,可以从听、说、读、写等方面衡量受试者的语言能力;
  3.一道试题测试一个语言点,因此题项较多,测试内容覆盖面较宽;
  4.语言情景无限,但语言成分有限,因此测试语言成分更有效,而且题项可以是孤立的;
  5.测试要精确客观,测试结果便于统计分析各项指标(如难度、区分度等),最典型的题型是多项选择。
  正当分离式测试受到人们的青睐时,其理论基础——结构主义语言学理论却受到了新的挑战,人们逐渐认识到,无论是其理论基础还是分离式测试本身都存在一些问题:
  (1)语言结构可以一层层分离开来吗?语言技能可否分割成孤立的成分?
  (2)“题型作用”也引起不少测试专家的注意。“题型作用”指的是考试成绩可能受题型影响。
  (3)分解测试有一个固有问题,即出题标准是尽可能增大区分度。题目取舍完全以统计数字为依据,只要某题区分度不足就要换掉,不管测试的语言点是否改变。这显然有悖于教学目的和语言使用的实际。
  需要指出的是,心理测量——结构主义法倍受重视,是由于它第一次给语言测试提供理论依据,标志着科学测试时期的开始。信度、效度及其他基本测试概念的引入对于试题优劣评价都十分重要。此阶段的最大成绩是多项选择题,虽然此题型备受争议,但设计科学的多项选择题对于大规模标准化测试、机器阅卷等贡献巨大。语言测试专家Heaton认为,多项选择题与之后的交际语言测试并非是非此即彼的关系,在很多交际测试中仍可限制性地使用此题型,特别是测试阅读和听力时(Heaton,1988 )。
  
  三、心理语言学——社会语言学阶段
  
  随着人们对语言认识逐渐深入,结构主义语言观受到了挑战。1965年,Chomsky的转换生成语法使语言学界开始重视语言本质上的创造性(creativity)和话语的无限生成性。以转换生成语法理论和当时正在兴起的认知心理学为基础,一门新的边缘学科——心理语言学产生了。心理语言学的基本原理是:人的大脑先天具有掌握语言的机制,人使用语言是大脑的创造性活动,语言能力包括语言使用者关于语言的全部知识。20世纪60年代后期,着重研究语言与社会关系的社会语言学受到了人们的关注。社会语言学的最大特点是,强调语言的使用受到人们的社会地位和环境等社会因素的制约。基于此,Oller在对分离式测试提出严厉批评之后,提出两大理论假设:一是语用预期语法(pragmatic expectancy grammar):语言的创造性和冗余性能够使语言使用者预见到所给予的语言线索之外的内容;二是整体能力假设(unitary competence hypothesis):强调语言能力的不可分性。根据这两种假设理论,Oller提出了综合式测试法(integrative approach),其主要特点是:
  (一)把听、说、读、写等技能综合起来测试,从而衡量受试者的综合语言能力;
  (二)强调语境在语言使用中的作用,测试考生在一定语境中使用语言的能力;
  (三)测试题型主要有完形填空和听写等。
  如果“整体能力假设”成立,大纲和试题设计者的工作会大大简化。但是这一假设与人们的语言教学实践不符。操一口流利口语的人可能写作能力很差,文章写得好的人未必口语好。并非所有外语学习者都能全面、平衡地发展各项语言技能。
  听写和完形填空能有效地反映一名考生整体语言能力的观点也受到了挑战。Alderson(1978)发现完形填空并非有效的测试手段。只要换一篇文章,改变空与空之间的字数或评分标准等条件,考生成绩就会改变。而且操本族语的应试者完形填空成绩往往相差悬殊,有的甚至比非本族语的应试者还低。上文提到的“题型作用”很可能在完形填空中也很明显,考生成绩未必反映考生水平。
  总之,“整体能力假设”不具有足够的说服力,Oller的逻辑推理也不严密。但是在某些情况下,“整体能力”的概念和完形填空这种衡量大量考生对语言知识总体掌握水平的便捷方法还是十分有效的。因为完形填空和听写出题方便,容易打分,它们作为能测试大量考生的语言能力而成本低廉的测试手段仍具价值。
  
  四、交际能力测试阶段
  
  随着人们对语言本质认识的不断深入,20世纪80年代中期以后又出现了交际测试法。由Bachman(1990)提出的交际语言能力模型理论是迄今为止最具影响力的里程碑式的交际语言能力模型(Skehan,1991),是交际测试法的理论基础,这一模型是在Canale和Swain(1980)提出的交际能力模型的基础上发展而来的。Bachman交际语言能力模型理论认为交际语言能力由语言能力(language competence)、策略能力(strategic competence)和心理生理机制(psycho physiological mechanisms)等三项语言能力要素构成,它们之间的关系是互动的、相互依存的。其中语言能力又包括组织能力(Organizational competence)和语用能力(Utilizing competence )。
  交际能力测试法认为,测试不可能抛开策略能力和语言的心理生理机制,孤立地对语言能力本身进行测试和考察。测试从构卷、命题、阅卷到考后记分等各具体过程中都应考虑到策略能力及心理生理机制等因素对语言行为的影响。
  在测试所要考察的内容方面,交际测试法认为测试首先应重视语言行为的交际性而非语言形式的正确性。因此,在领会性技能的考察中,交际测试法强调的是理解说话人或作者的主要意图,而不是语言描述的细节部分;在产出性技能的考察中,强调产出句子的得体性,即要适合语境的要求,而不是其语法准确性。
  从测试的任务类型来看,交际能力测试法的测试任务注重对交际语境特色的突出,强调测试任务对真实交际语境最大程度上的模仿,追求测试的真实性。因此,在试题任务的设计中,交际测试法努力收编那些受试者在实际生活中可能遇到的题目,并尽可能增加真实语境中所特有的时间压力、互动性、目的性、不可预知性等特色,使测试任务在最大程度上接近生活中的交际任务。在真实交际语境中,人们并不总是以正确和错误这样的标准来评价语言行为。基于这一点,交际测试法在它的评估体系中引入了尺度参照(criterion reference)的评估标准,每个尺度等级都对受试者应具有的接受或产出性技能有详细的描述和规定。交际测试法虽然注重等级测评标准的使用,也并不排斥常模参照(norm-reference)标准的应用。事实上,交际测试法提倡使用多重而非单一的测试标准。在具体测试中,采用何种评估标准主要由测试目的决定。
  交际能力测试法由于测试任务完成结果的质量等级要由考官或阅卷员来判定,这就给阅卷的信度带来了负面影响,因为无论如何都不能保证评分员之间、评分员自身和评分标准之间保持绝对的一致。目前对这一问题也只能采取增加评分员的数量、并加强对评分员的培训的办法。除此以外,尺度参照法还有一个致命的弱点,即对交际语言能力的等级尺度严格的划分只能存在于理论中,事实上既不会存在语言能力为零,不会存在语言能力完美的语言使用者,因此,在交际语言能力等级标准的制定过程中,也不可避免地存在着人为的主观因素。这一切都使人们对交际能力测试法的信度提出质疑。
  
  五、语言能力测试的现状
  
  以上各种语言能力测试模式各有优点和不足,但重要的不是比较它们的优劣,而是根据它们各自的特点加以充分利用。心理测量学测试因信度高、命题较难、评阅迅速可靠,适用于大规模语言能力测试。但心理测量学测试是以一定程度上牺牲效度来取得高信度的,应尽量避免将其过多应用到日常教学的练习中。
  心理语言学测试可行性高,又有较高的准则关联性效度,评阅比较客观,适用于不很重要的、中小规模的、不需要诊断信息的语言测试。心理语言学测试虽属间接测试,但采用的是有限答案题型、设计简便、可用作教学辅助练习。但不能用来练习具体语言项目,且不能准确反映学生学习中的问题所在,因此不可过高估计它在练习中的作用。
  交际语言能力测试是考察学生语言运用的准则参照式测试,适用于为每一教学单元配置语言运用性练习和会话能力的测试。该法效度高,是培养学生交际能力的好方法。课程练习不需要测试所需的高信度,这也正好弥补了交际语言测试信度上的缺陷。交际语言测试可能是测量会话能力最适合的方法,特别是考虑到心理测量学测试和心理语言学测试都没有为测量会话能力提供高信度题型,因此我们有充分理由选择交际语言测试方法。
  另一种方式是在语言能力测试中综合利用这三种模式,即以心理测量学测试为主,辅之以心理语言学测试和交际语言能力测试。但也应注意到这样做在实践上有所得,在理论上有所失,因为这打破了测试理论的系统性和完整性。不过在目前情况下也可能只有折衷才是可取的语言能力测试理论模式。
  
  参考文献:
  [1]Aderson.J.C.A Study of the Cloze Procedure with Native and
  Non-native Speakers of English[D].PhD thesis.University of Edinburgh,1978
  [2]Bachman,Lyle.F.Fundamental Considerations in Language
  Testing[M].London:Oxford University Press,1990.
  [3]Heaton.Writing English Language Tests[J].London: Longman,
  1988.
  [4]Oller,John.W.Language tested at School[J].London: Longman,
  1979
  [5]冯雪.国外语言测试发展的过去和现在[J].北京:现代外语,
  1989,(2).
  [6]李清华.外语测试:历史、现状与展望[J].四川外语学院学报,
  2001,(5).
  [7]李岩,张良平.语言测试的发展[J].清华大学教育研究,1995年
  增刊.
  [8]刘润清,韩宝成.语言测试和它的方法(修订版)[M].北京:外
  语教学与研究出版社,2000.
  [9]陶百强.语言测试理论的发展[J].基础英语教育,2004,(9).
  [10]左年念.外语测试理论的演变与发展[J].广东外语外贸大学学
  报,2001,(4).
  (周霞艳 上海交通大学国际教育学院 200030)
其他文献
摘 要:现代汉语中双音节词以其数量上的绝对优势成为汉语构词形态的基本形式。但上古汉语词汇却以单音节词为主,双音节词很少。从单音节词占主导地位发展到以双音节词为主流,期间经历了漫长的发展过程,其中魏晋南北朝时期可谓是汉语词汇双音节化的第一个高峰期。本文着重从社会发展、骈文的繁盛以及佛教文化的传播三个方面对汉语词汇双音节化在魏晋南北朝时期进入繁盛期的原因进行了探究。   关键词:魏晋南北朝 汉语词汇
欧洲议会近日通过了一项果汁产品标准新法规,以防止欺瞒消费者,并保护消费者的健康。新法规对欧盟2001年版果汁标准法规进行了修改,细化纯果汁、果浆或果泥果汁、混合型果汁的区
目前,上海郊区经济正处在发展的重要关口。2005年以来,由于受宏观调控政策等多方面因素的影响,上海郊区部分主要经济指标出现明显下滑,增长势头有所减弱。虽然问题的核心是由地根
现代汉语中的第二人称系统中有平称“你”和敬称“您”,说话人选用哪种形式,表明了交际者双方的关系以及言者对听者的态度。我们借用了语域概念和语用学的理论,对同一语域和不同
党中央把发展现代农业作为社会主义新农村建设的首要任务,是以科学发展观统领农村工作的必然要求。上海历届市委、市政府认真贯彻落实党在农村的各项方针政策,切实加强“三农”
本文在认知语言学的理论框架内,运用Talmy的图形——背景理论,Lakoff的图式理论以及动词概念化理论,从结构、认知图式及方向三个方面探讨了英汉存在句的个性和共性。结构上,
欧盟从1997年开始逐步建立起了食品追溯制度。可追溯性,通俗讲就是要求食品配有“身份证”。在欧盟委员会于2002年1月制定的《基本食品法》(即欧洲议会和理事会第178/2002(EC)号法
多年来,南汇农业始终立足自身优势,经过积极探索、大胆创新和成功实践,走出了一条具有鲜明地方特色,在上海乃至全国具有一定知名度的“高效生态型”特色农业之路,从而实现了农村稳
金山区位于上海西南远郊,从当初名不见经传的“农业县”到今天面貌大变的金山区,是一个不平凡的过程。50年代社会主义新农村建设,在群众中流传的口头禅“点灯不用油,耕地不用牛,楼