论语言测试效度的辩论方法

被引量 : 18次 | 上传用户:gdcjr
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文主要研究语言测试效度的辩论方法,或者说,基于辩论的语言测试效度验证方法(Argument-based Approach to Language Test Validation),总体上包括两个方面的内容:辩论逻辑和效度解释,具体又分为五个方面进行讨论。第一,本文研究了几个较有代表性、影响较大的辩论框架的辩论逻辑,着重分析了其中的逻辑缺陷及其产生的根源。所研究的框架都声称其逻辑结构为哲学研究领域的辩论模型——Toulmin模型,但在应用Toulmin模型时又都对其基本结构进行了修改。修改后的模型,其中的推理过程有可能陷入一个永无止境的“死循环”(an endless loop),辩论过程也有可能变成为一个自相矛盾的自我辩论过程,并且“声明”(Claim)也不再是声明而实为假设。没有声明的模型,本质上已不再是辩论模型。不过,修改版中虽有假设,却并不是假设检验模型,因为其中没有接受或拒绝假设的条件判断机制。进一步研究还发现,逻辑错误的产生主要是因为误解和误用了Toulmin模型中的“反驳”(Rebuttal)所致。第二,本研究提出了一个累进辩论结构(Progressive Argument Structure),并强调通过累进辩论的方法对测试效度进行解释。累进辩论结构不仅修正了相关辩论框架的逻辑错误,还将科学调查中的数据分析(Data Analysis)手段纳入到了理性辩论的逻辑推理过程之中。效度验证往往会涉及各种各样的复杂数据,多数情况下仅凭主观逻辑推理难以得出合理结论。通过在模型结构中增加一个条件判断要素和一个数据分析要素,就可以在进行逻辑推理前对理由(Warrant)是否充分进行判断。如果有充足的理由,则按Toulmin模型结构进行推理,否则即进行数据分析,以产生新的、更有说服力的证据数据。这种设计使得模型具有了递归机制(a recursion mechanism)。递归的结果会产生一系列声明,并且这些声明形成一个层级结构,一个声明的形成以前一个声明为基础,最后声明是所有前期声明层级累进的结果。这正是“累进”的真实含义之所在。第三,本研究提出了以目标构念为中心、以环节效度为基础的累进效度观(a progressive view of validity)。累进效度观强调每个测试环节产生的数据都应该充分体现测试的目标构念,效度也就是数据准确体现构念的程度。效度本质上是一个程度问题,但也存在“有效”和“无效”之分。程度高达可以接受的合理水平即为有效,低至不可接受的水平层次即为无效,有效和无效是对测试的定性评价和基本态度,不能因为效度是一个程度问题而对测试究竟是否有效含糊其辞。累进效度是各个环节效度逐级累进的结果,前任环节是后继环节的基础,一个环节失效,则整体无效。但是,效度累进不同于百分比累积,累进效度不大于最薄弱环节的效度。此外,累进效度辩论不必局限于分数的解释和使用,效度在设计之初即已存在,测前具有预期效度,测后具有实际效度。为了确保测试具有理想的实际效度,测前每个环节都应具有理想的预期效度。每个测试环节都应该进行相应的效度验证,对该环节的效度作出合理解释、做出恰当决策、并预计相应后果。第四,本研究提出了话语信息认知处理能力构念观。本文强调考察能力构念,仅停留在能力结构或认知过程的宏观分类上是不够,还应具体到语篇、深入到语义,从更微观的层面考察考生生成和理解话语信息的能力。并且,为了更好地从语义理解的准确率和速度、语义生成的质量和数量的角度考察语言能力,还必须解决语义的认知量化与计算问题。为此,本文首先在系统论、信息论和控制论思想的指导下,建构了话语信息认知处理系统框架和话语信息认知处理能力模型;然后以计算机面向对象理论为指导,借鉴计算机认识世界事物的方式分析语义的结构形式和计算单位,实现对语义的认知量化和统计计算;最后在语义认知量化的基础上,提出信息最大化命题方法,通过最大化计算、抽样加权、归类整理、题目编写等几个环节,为命题效度辩论提供测试内容证据。第五,通过两个实例,介绍信息最大化命题方法和累进效度辩论法在命题实践中的应用。命题方法实例基于一个150词的短小语篇,编写4道多项择阅读理解题。辩论法实例特别针对选项可猜性这一测试效度的反面解释进行辩论,其主要目的在于介绍如何通过理性辩论与科学调查相结合的方式,对命题效度进行证伪辩论,同时兼顾调查了我国高考命题对选项可猜性的控制情况。此实例调查了3套高考试卷,共计74道多项选择题、259个选项。结果发现,调查卷的选项可猜性比较严重,我国高考命题有必要采取更有效的措施,加强对选项可猜性的控制。由于涉及面广,本研究未能针对各个测试环节深入拓展,信息能力构念研究和信息最大化命题方法也有待于在实践中进行进一步检验。
其他文献
本文通过对资本结构与公司绩效相关理论的学习,在综合分析国内外研究成果的基础上,以2007-2009年中小企业板上市公司为研究对象,对其资本结构与公司绩效的关系进行实证研究。
针对实现碳存储技术的大规模应用问题,提出以管道网络为基础的碳存储网络设计模型.通过将管道运输的特点与最小生成树方法相结合,提出考虑节点流量的连续节点最小树方法,建立
猪繁殖与呼吸障碍综合征(porcine reproductive and respiratory syndrome,PRRS)是由猪繁殖与呼吸障碍综合征病毒(porcine reproductive and respiratorysyndrome virus,PRRSV)
随农村老龄化高峰临近,农村居民对养老保障的需求不断增加,因此为规避农村养老风险、使农民老有所养、维持农村地区社会稳定成为政府当前无法回避的责任,国务院联合人保部于2009
思维监控是思维结构中最重要的组成部分,数学解题中的思维监控,是指解题者对解题思维活动的自我分析,自我控制和自我调整.教学中注重学生解题思维监控能力的培养,有利于提升
论文关注的是徜徉在油画创作领域内的版画艺术家,通过对创作机制和美术史的梳理,以及对艺术家个体的近观和剖析,试图寻找这一转向的动因和契机,并在更广阔的艺术创作视野下对
肿瘤治疗是当今世界公认的公共卫生难题之一。由于受适应症、禁忌症等因素限制以及治疗副作用的影响,现有肿瘤治疗方法的疗效均不甚理想。不可逆电穿孔治疗肿瘤技术,作为一种
《红楼梦》是我国古典小说的高峰,也是世界文学史中一颗璀璨的明珠。《红楼梦》前八十回的作者曹雪芹,不仅仅是一位文学家,小说家,他攻诗善画,把绘画艺术运用到《红楼梦》的语言艺
电视剧作为目前最为成熟、最具代表性的电视内容资源,以及大众最喜欢的节目类型和频道最重要的广告依托,己成为卫视间收视竞争的焦点。省级卫视对电视剧资源精耕细作,竞争日
粘多糖是广泛存在于动物体内的一类多糖,动物体内的多糖除了作为能量代谢的糖元外,基本上都属于粘多糖。透明质酸是粘多糖中最具代表性的一种,因为透明质酸被认为是唯一几乎