有根·有效·有度:未来学科评价需关注三个重点

来源 :中小学管理 | 被引量 : 0次 | 上传用户:zjcamel
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要中小学在未来教育评价研究与实践中需关注三个重点问题:一是聚焦核心素养,探索表现性评价的设计与应用,使评价嵌套进真实的生产生活情境中;二是注重效度分析,使评价能有效测量欲测的特质,并为有关推论与决策提供有价值的依据,提升评价的科学性;三是承认评价的局限性,适时适度地评价,避免过度评价所引发的负效应。
  关键词教育质量评价;学科评价;核心素养;综合素质评价;表现性评价;发展性评价;效度分析
  中图分类号G63
  文献标识码B
  文章编号1002-2384(2018)02-0005-03
  当前,很多中小学校已开始在课改理念与核心素养框架的引领下,从明确学校发展愿景与培养目标入手,系统思考与设计教育评价改革思路,并在评价主体多元化、新兴评价方式应用、教学评一致性等方面取得了明显突破。同时,如何在现有基础上进一步推动评价研究,以充分发挥其激励与导向性功能,也成为摆在教育者面前的新课题。基于日常在一线的深入观察,笔者认为,未来中小学教育评价研究尤其是学科评价中应关注三个重点问题。
  一、聚焦核心素养,探索表现性评价的设计与应用
  为全面深化课程改革,落实立德树人根本任务,2016年,《中国学生发展核心素养》总体框架正式公布,基于核心素养的课标修订、教材编写及评价改革也陆续启动。尽管仍有人对核心素养框架的表述存在质疑,但对于学校和教师究竟应重点培养学生哪些具体能力,教育者并不难达成共识。例如:褚宏启提出在基础教育领域应关注学生的六项核心素养,分别是创新能力、批判性思维、公民素养、合作与交流能力、自我发展素养与信息素养。[1]这一提法不仅与我国官方认可的核心素养框架保持基本一致,且由于更具体化而更容易使教育者找到操作抓手,故得到比较广泛的认可。因此,在核心素养培育的宏观背景下,中小学不能将目光仍然局限于学科教学以及对学科知识的掌握,而要参考国内外有关框架和思路,结合本校实际情况,明确学校所关注的核心素养,并在评价研究中关注对学生必备品质与关键能力的培育。
  具体到核心素养评价,教育者需要借鉴国外经验,在实践中探索表现性评价技术的应用。表现性评价通常要求学生运用先前所获得的知识,解决某个生产生活情境中的真实问题或创造出符合某种特定标准的成果,教师通过观察学生完成任务的过程与结果评价学生表现。[2]这种评价方式克服了传统测验中仅能测试低水平知识和孤立技能的弊端,能有效评价学生在真实世界中应用所学知识与技能解决问题、交流合作及批判性思考等多种复杂能力,特别适合于核心素养评价。
  以一道小学五年级数学题为例,有教师在教完“组合图形面积”一课后,在当堂检测中出了这样一道题:
  智慧老人要装修自家的客厅,客厅形状及各面墙的长度如右图所示,他家的客厅面积有多大?
  从整体上看,这道题已经具备了表现性评价的雏形,创设了一个看上去比较生活化的情境,但由于智慧老人不是真实的人物,其情境本身是虚假的,加之题目难度太低,因此并不能有效考查学生在真实生产生活情境中运用学科知识解决问题的能力。
  如果将题目修改成:“张爷爷买了套小单元房,房产证上注明这套房子的建筑面积是38平方米,可张爷爷感觉家里没有那么大。他测量了家里几面墙的长度,如图(同智慧老人一题),请问开发商是不是测量错了?”那么我们可以看到,题目修改后所涉及的情境相对真实得多,学生在解题过程中需要分清商品房的建筑面积、套内面积及使用面积等相关概念,能较好地评价学生的问题解决能力。如果所提供的房屋平面图再稍复杂一点,增加学科知识的难度,那么这道题就变成了一道优秀的表现性评价题目。
  因此,深入研究表现性评价,特别是非纸笔类表现性评价,使评价嵌套进真实的生产生活情境中,有效考查学生的问题解决能力、沟通合作能力、批判性思考能力、信息媒体技术等多种跨学科核心素养,这是未来评价改革应该关注的重点。
  二、注重效度分析,提升评价研究的科学性
  评价的质量如何也需要被评价。学术界将对评价的评价称为元评价。[3]通常,人们在元评价中主要分析试题的难度和区分度,即便是建立在项目反应理论基础上的深入分析也是如此。但实际上,教师在实践中接触最多的当堂检测、单元验收、期末考试、毕业水平测试,乃至大规模的教育质量监测,都是标准参照性质的测试,是绝对评价,其主要目的是检测学生达到既定学习目标的程度。在这种测验中,教师不需要刻意控制题目的难度和区分度,只要严格依照课程标准、教材和教学目标编制题目,同时考查点在预测目标范围内,是教学的重点,即使題目特别容易或特别难,都可以是好的题目,也可以出现在测验中。[4]
  因此,反映评价质量好坏的最重要指标不是难度和区分度,而是效度。很多人会望文生义地认为,效度就是评价有效性的程度,以及有效促进学生学习与发展的程度。这种理解在方向上似乎没有错误,但专业性不够。从专业角度来看,效度是一个综合性概念,是指评价能测到所要测量特质的程度以及能为有关推论与决策提供有价值依据的程度。以七年级语文“口语交际”教学评价为例,有教师在单元验收中出了这样一道题目:
  “同学们,我们每个人心底都有自己的秘密。今天晚上回家后,请和你的父母说说你心底的秘密。你会如何说呢?请把它写下来。”
  这道题要考查的是学生口语交际能力达成单元目标的程度,但它让学生将想说的话写出来,实际上考查的主要是书面语言表达能力,而不是口语交际能力。想测量的特质没有测量到,就是效度不良。一旦效度不良,我们就无法对学生的学习水平和教师的教学质量做出准确有效的判断。可见,一道测试题或者一套评价方案,只有效度良好,才能产生好的评价。如果试题效度不良,即使其难度、区分度等指标都合乎测量学要求,也没有什么实质意义,也不是好的评价。   效度好是高质量评价的首要条件。由美国教育研究协会、美国心理学协会与全美教育测量学会共同编定的《教育与心理测试标准》是当前元评价领域影响最大的一个分析框架。1999年版及2014年最新版本的《教育与心理测试标准》都强调效度是评价最基本的要求,所有评价必须保证其能测到所欲测的特质,能依据所收集的信息做出准确而有效的推论。[5]在实践层面最具影响力的美国教育考试服务中心也反复强调,效度是反映试题质量最为重要的指标,测验编制者必须清晰界定要测量的特质,并提供概念性、实证性或理论性证据说明推论解释的有效性。[6]
  但必须承认的是,效度分析在我国尚未受到足够重视。教师、教研员、研究者,特別是参与各种考试命题的人,需要认真学习有关专业知识,掌握分析试题、试卷及评价方案效度的技能,提高评价研究的科学性。
  三、适时适度评价,避免过度评价引发的负效应
  评价是质量管理体系中的重要环节,在课程改革与教学实践中受到广泛重视。“教育测量学之父”桑代克曾说过,“凡客观存在的事物都有数量,凡有数量的事物都可以测量”。[7]但我们必须承认,这只是经典测量理论的一个假设,就人类所掌握的技术而言,不少心理特质因为具有间接性、隐蔽性、随机性与复杂性等特点,目前仍难以进行准确有效的评价。所以,教育者必须注意到评价工作的这种局限性,不能急躁冒进,更不能为评价而评价。
  为评价而评价,如果评价效度不良,抑或在难度、区分度、信度等方面存在瑕疵,不仅不能准确评判学与教的质量,而且会对实践产生或大或小的误导。有些地区或学校在综合素质评价实践中评价学生个体道德品质、学习能力、创造性,或者审美情趣的某些做法,已经显现出这种负效应。
  “为评价而评价”现象中还有一种亟待关注的表现就是教师评价过多。在本轮新课改推进过程中,教师开始接受发展性评价理念,将终结性评价与形成性评价结合起来,注重在教学过程中开展即时和动态呈现的形成性评价。但有些课堂出现了满堂评的问题,有些学校甚至谋划以各种方式记录和评价学生的一言一行,导致学生无时无刻不被评价。这在无形中织就了一张大网,不要说消极的评价,即使是完全无条件的赏识性评价,也会给学生造成难以想象的压力。
  1973年,心理学家莱珀基于儿童绘画兴趣实验的发现提出过分肯定理论。她指出,当个体从事一项自身感兴趣的活动时,外界所给予其的奖励会使活动成为一种达到目的(获奖)的手段,那么个体以后从事这种活动的兴趣就会降低。[8]将这一理论嫁接到评价实践可以预见,如果一个学生的某种努力、进步或成就频繁得到教师的赏识性评价,学生担心失败的压力会增大,而且追求进步的动机会由内在动机转变成外在的工具性动机,会在很大程度上影响其长远发展。相反,如果教师适当减少评价和激励,反而可以激发学生的内在成就动机,培养其自我评价、监控与发展的能力。
  因此,评价很重要,但也要适度。“好雨知时节,当春乃发生”,只有评价做到适时、适量,且科学有效,才能更好地发挥其导向、激励、诊断和发展的积极功用,促进教与学的改进,也服务于学生的成长。
  参考文献:
  [1] 褚宏启. 核心素养的国际视野与中国立场—21世纪中国的国民素质提升与教育目标转型[J]. 教育研究,2016,(11).
  [2][4] 赵德成. 促进教学的测验与评价[M]. 上海:华东师范大学出版社,2016.
  [3] Kevin S, Scott B.Meta-assessment:assessing the learning outcomes assessment program[J]. Innovative Higher Education,2016,41(4).
  [5] 美国教育研究协会,美国心理学协会,全美教育测量学会. 教育与心理测试标准[M]. 燕娓琴,谢小庆,译. 沈阳:沈阳出版社,2003.
  [6] Educational Testing Service. 2014 ETS Standards for Quality and Fairness[EB/OL].(2015-05-01)[2018-01-29]. http://www.ets.org/ s/about/pdf/standards.pdf.
  [7] Thorndike E L.The nature,purposes and general methods of measurements of educational products[M]// Whipple G M (ed.) National Society for the Study of Educational Products:Seventeenth Yearbook. Bloomington, IL: Public School Publishing, 1918.
  [8] Lepper M R,Greene D,Nisbett R E. Undermining children’s intrinsic motivation with extrinsic reward: A test of the“over-justification”hypothesis[J]. Journal of Personality and Social Psychology, 1973, (28).
其他文献
摘要:本文以一节词汇教学课例,介绍了教授词汇的方法,即在情景中渗入构词法教学。在完成一个个任务中,让学生学有所乐,学有所得;同时培养学生的想象力和创造力。  关键词:情景教学 构词意识
物理是一门以实验为基础的自然学科,根据物理学科的特点,在物理教学中进行德育教育是物理课程标准明确要求的,在平时的教学实践中,有效结合德育教育,才能促进学生全面发展.通
物理学概念和原理并非孤立的知识,物理知识与科学史相联系,同时又随着时代、科技的发展而发展,反映着人们对世界本质的认识,而且在诸多科学家的不懈努力下对客观世界的认识更加准确、深刻和全面.笔者认为高中物理课堂必须以文化价值为主线组织教学,提高课堂教学的效果.  1重演“准历史现象”  物理知识往往与物理学史相对应,那么,前人是如何研究的?对我们今天的学习有怎样的影响?笔者认为,我们可以从历史教材中“拿
本文论述了“四课”制度的科学内涵以及如何有效的组织开展这一工作的基本过程。并重点阐述了“四课”制度的开展对“双新”教师教学水平的提高、课程建设以及教研室作用的发
学生实验能力的核心部分是基本仪器的使用,实验操作的基本功自然也离不开对仪器的熟练掌握.在高中物理教材中需要学生分组进行的19个物理实验中,要求掌握基本仪器使用和将基本仪器作为主要实验器材来进行的物理实验就占到12个,又可以将这12个实验归为两大类,一类是基本实验的使用,另一类则是将基本实验作为主要器材从而来进行的探究性或实验性实验,对于第一类实验,要求学生要对基本仪器的使用方法熟练掌握;第二类实验
摘要:词汇是语言教学的重点和难点。但很多中学生对于英语词汇学习感到吃力,甚至因此对英语学习丧失了兴趣。本文分析了目前词汇教学过程中存在的主要问题,并提出了相应的对策和建议。  关键词:新课程 词汇教学 问题 对策    一、研究背景    词汇教学是英语教学中的重点,同时它又是中学英语教学的难点。多年来,死记硬背词汇表是很多高中生记忆词汇的主要方法。新的高中英语课程标准对高中毕业生的英语词汇要求有
物理实验误差通常分为偶然误差和系统误差.偶然误差是由于实验者本人的主观意识、测量环境、仪器等不确定因素所带來的不可避免的波动,使得在多次测量时出现实验数据偏离实际值的现象.这种误差可以通过多次测量求平均值的方法来尽量减小.  实验中系统误差则是由实验中的一些确定因素引起的,如仪器本身的缺陷、测量时的客观环境条件、实验方案的完备程度及理论模型的抽象与近似等.它所带来的误差不会时而偏大、时而偏小,且每
中考均分落差是评价一个地区义务教育均衡化和素质教育推进程度的重要指标.为了找出问题、分析原因、缩小差距,近期笔者随教育局教研室的学科专家组对本地区中考均分排名靠后
摘要:在英语教学中,英语新课程的主要任务是:创设各种合作学习的活动,促使学生相互学习,相互帮助,体验成功的喜悦,发展合作精神,使学生认识自己学习的优势与不足,乐于与他人合作,养成积极、和谐、健康向上的品格。在新课程标准理念指导英语教学的今天,组织有效的英语小组合作活动显得非常重要。以下是我通过对小组合作学习的探索,结合《英语课程标准》和有关教学资料,联系教学实际,谈谈关于小组合作学习在英语课堂中运