论文部分内容阅读
作为一个针对中国高校英语专业本科生的全国性、标准参照性考试,随着考生数量不断增加,影响力逐年扩大,TEM-4已成为我国不可或缺的大规模外语水平测试。经过近20年的探索和实践,该测试已经日臻完善,具备了较高的科学性和权威性,为检验和促进我国英语专业教学质量做出了重要贡献。自从1990年TEM-4测试实施以来,关于它的效度研究就没有间断过,但影响分数解释的内容代表性不足问题仍然存在,而且大多数效度研究依旧采用单一的定量分析方法来获取数据,忽略答题模式与考试技巧层面的因素,研究结果难以令人信服。加之,当前国内对TEM-4的效度研究集中在阅读理解方面,鲜有涉及听力理解。基于上述原因,本研究从效度整体观出发,运用听力理解试题内容效度检验框架,来验证TEM-4在2011年至2015年之间的内容效度。本研究旨在校验TEM-4听力理解包括的样本是否可以准确测量目标域,也就是该测试是否具有较高的内容效度。为了实现这一目标,作者阅读大量听力理解内容效度方面的相关文献,结合定量分析和定性分析方法,开展了以下研究:首先,从效度的定义出发,系统地梳理其内涵和外延,总结了每个发展阶段的特点和不足,并对内容效度和听力理解的相关文献进行分析,最终以Bachman、Palmer、Weir和Messick的研究成果为基础,确定了验证TEM-4听力理解内容效度的理论框架;其次,结合TEM-4教学大纲和考试大纲的需求,运用之前确定的验证TEM-4听力理解内容效度的理论框架,详尽地对TEM-4听力理解的施测环境、题目说明、试题特征等方面进行了分析;最后,为了给前面的研究获取更充分更直观的数据,作者设计了两个步骤的实证研究来衡量测试分数是否真实的反映了受试的听力水平。一方面是采用共有20个题目的调查问卷,收集120名受试关于对话、短文和新闻各部分的答题感受;另一方面是采用“即刻内省法”对10名受试的答题模式进行记录和分析,通过对比测试成绩和实际成绩,找出预期回答特征和受试答题模式之间的区别。研究结果表明,TEM-4的施测环境、测试时间、测试工具方面满足要求,并且形成完整成熟的体系。但是,受试通过收音机接收广播信号的方式效果欠佳。在任务特征方面,具体表现为:(1)语音材料篇幅长短较为合理,题目问题和选项的字数对于受试的阅读速度要求高于同等水平下的阅读理解测试速度;(2)生词比例适中,但主要集中在新闻部分,分布情况不够理想;(3)主题类型多样,贴近日常生活实例;(4)言者语速和口音满足教学大纲和考试大纲的需求,且语速存在逐年上升趋势。问卷调查部分的结果显示,TEM-4听力理解内容证据的指标理想程度有一定差异。其中,非常理想和比较理想的指标是:(1)TEM-4听力理解在材料主题内容和熟悉程度方面做得比较成功;(2)TEM-4听力理解的短文部分整体难度和《教学大纲》比较吻合。不太理想的指标是:(1)TEM-4听力理解语音材料的语速与大纲要求存在差距;(2)TEM-4听力理解受试通过收音机接收广播信号的方式效果欠佳。对受试答题过程的分析结果表明:(1)TEM-4听力理解存在受试运用听力无关技能答对题目的现象;(2)TEM-4听力理解考察字面文字理解能力的题目设计得太多。T检验结果表明:(1)受试的测试成绩与实际成绩之间存在显著差异;(2)受试的测试成绩都比对应的实际成绩分数高。此外,无论以何种考试为研究范式,都无意对考试本身做出评判。最重要的不是针对该考试所得出的结论正确与否,而是该研究所体现的理论知识、所采用的实证研究方法和所得出的具有普遍意义的结论。作者希望本研究能够充分利用研究生阶段所学相关知识,丰富TEM-4听力理解内容效度研究,给予英语专业教学积极的反拨作用,并且帮助命题者改进题型模式,为TEM-4效度验证和听力理解测试发展做出一点贡献。