基于语料库计量分析的口译加工特征研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:weixiant241
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
口译作为一种双语加工任务倍受关注,与它两方面的属性密不可分:一是口译在全球化背景下不断凸显的跨文化、跨语言交际工具属性,二是它在持续细分的社会功能领域(媒体、政治、教育等)中所体现的社会活动属性。从任务要求来说,口译不仅是一种语言和知识技能,更是一种认知技能(Swabey et al.,2016)。与一般的翻译任务相比,口译的特殊之处在于其需要在巨大的时间压力下实现密集信息在不同语码间的流动和转换,从而面临极端的认知需求(Christoffels et al.,2006;Seeber,2011;Dong&Zhong,2017;Liang et al.,2017,2019;Lv&Liang,2019)。因此,认知加工机制始终是口译研究的核心范畴之一。考察口译的认知加工主要有两种研究范式。一是口译过程导向的实验研究,通过获取口译员在口译任务实验中的实时行为数据,来分析影响译员口译绩效或特定口译任务模块(如笔记、视觉加工)的认知基础、特点及策略等(Shlesinger,2000;Bart?omiejczyk,2006;Gile,2009;Lin et al.,2018;Dong et al.2019;Stachowiak-Szymczak&Korpal,2019;Chen,2020a,2020b)。二是口译产出导向的研究,特别是基于口译语料库的研究,通常从“语言学、偏误及话语特征”等方面考察口译产出文本(Abdel Latif,2020,p.111),这些特征能一定程度上归因于口译任务的认知因素,从而具有一定潜力去“逆向还原”(reverse-engineer)口译的认知加工过程(Shlesinger,1998;Setton,2011;Kotze,2019)。这两种研究范式各有利弊。过程导向的方法得益于其严格的实验控制,容易在语言加工机制和产出特征之间建立起可靠的因果关联,但因为口译任务的特殊性,过程范式在被试招募、生态效度及数据规模等方面受到严重局限(Shlesinger,1998;Gile,2016)。产出导向的研究范式则面临(已发生的)口译过程中的混杂因素(confounding factors)难以控制的问题,所以研究结果的因果阐释力受限,但它能很好地克服过程导向范式的主要问题(Shlesinger,1998),特别是由于它能使用自然任务语境下的较大规模口译语料,因此具有较高的生态效度和计量效应,从而更有利于发掘具有普遍意义的语言使用模式(Setton,2011;Gile,2016;Liang&Lv,2019)。显然,整合两种范式的优点,扬长避短,才能更好地探究口译的认知加工机制。对基于语料库的口译研究来说,引入过程研究范式的视角和思路,可以弱化其通常面临的一些问题,强化其研究结果对于口译认知加工机制的阐释力。例如,可以在语料挑选及语料库设计过程中匹配一些重要因素,如有关译员背景和工作环境的变量(Halverson,2015;Kotze,2019),以及在数据分析过程中使用统计手段实现“事实之后”(after the fact)的混杂变量排除(Gile,2016)。另外,现有口译研究还存在一个问题,即缺少“跨模式对比”(cross-modality comparisons),具体而言,即一项研究往往只分析一种口译类型。交替传译(consecutive interpreting)和同声传译(simultaneous interpreting)是两种最普遍的口译类型,交传译员在发言人说完一段话(原文)之后的间隙提供该段话的译文,而同传译员则是听取发言者原文的同时逐句提供译文产出(P?chhacker,2010a,2010b)。根据口译的认知负荷模型(Effort Models of interpretation)(Gile,2009),两种口译加工机制不同,尤其是同传加工面临更为明显的多任务处理的时间约束(temporal constraints),而交传加工虽然多任务处理的压力相对缓和,但需要一次性加工大量信息,记忆需求很大,因此交传译员往往需要采用笔记方式辅助记忆原文信息。单单分析一种口译类型很难将其加工过程和产出文本特征联系起来,而对比探究两种口译类型则可以提供鉴别和参照。两类口译产出的特征差异可能反映出它们的加工过程差异,从而帮助我们更有效地结合口译理论模型分析两种口译加工机制的特点。虽然个别基于语料库的口译计量研究已应用上述整合思路去量化和表征口译中的认知加工因素,但仍存在两大缺口。首先,相关研究只使用了词汇、句法和语言序列层面几个有限的文本指标,采用的数据分析方法也较为单一。词汇层面研究一直是基于语料库的口译研究的主体,但相关研究通常局限于词频有关的参数,对于其它词汇信息维度(如词性)的分析十分少见。分析方法往往是局部的统计差异对比,而更具系统意义的手段如分布模型拟合等应用较少。其次,相关研究主要是基于整体性(global)视角去探索口译加工中的“平均”模式。例如,关于口译句法复杂度的研究(Liang et al.,2017)发现同传和交传产出之间系统性的平均依存距离(MDD)差异反映了两种口译加工机制的认知负荷高低,但该研究未考虑不同句法结构之间可能存在的认知加工差别,因此其整体性结论是适用于所有句法结构还是只适用于部分句法类型,还不得而知。因此,纳入更为“局部”(local)和“精细化”(fine-grained)的视角十分必要,这不仅要求在更深入的文本层次上应用相关指标,也要求以更细致的方式去阐释它们(如结合实际语言例证)。结合上述背景和思路,本论文引入几个具有重要认知内涵的语言计量指标,开展了三项基于较大规模真实口译语料库的研究,通过对两种口译类型产出文本的计量特征的对比分析,探索两种口译任务的认知加工机制差异,并在此基础上挖掘认知因素与语言特征之间的关联。前两项研究分别考察了两类口译产出的词性分布和词性序列组织模式,第三项研究探究了两类口译产出在不同句法结构类型上的(依存)复杂度特征。三项研究基于同一个口译语料库,其中包含同传和交传两个组别的译文和原文语料,源语(source language)为中文,目标语(target language)为英文。为最大化可比性(comparability),两个组别选用的语料在主要特征方面具有一致性,如同为中国领导人的发言,译者均为外交部翻译司顶级译员,相关会议语境、主题及话题范围相似,发言人语速较慢且接近,且口译工作环境类似,特别是两个组别的译员都是落座口译,这从一定程度上排除了工作环境因素可能导致的译员压力水平差异(Pokorn,2017)。原始语料中的一些非流利标记(如“嗯”和“呃”),在不改变语言结构的情况下进行了流畅化处理,使得最终分析的语料是较为规范的文本,以提升研究中自然语言处理环节的准确度。译文语料按自然时间顺序进行必要的分割或合并,形成同传和交传两个样本,每样本各含16个长度一致(约5000词)的文本,并根据译文样本构建了原文语料的平行样本。论文的第一项研究(第二章2.1节)基于一个原创性假设。不同词类对应不同的句法功能,其中动词和形容词的对比尤为典型,理论和实证研究普遍暗示在语言加工中动词相对于形容词有认知优先效应(Altmann&Kamide,1999;Baker,2003;Kamide et al.,2003)。同时,由于口译任务的极端认知压力常导致译员出现“错译、漏译及偏译”现象(Gile,2009,2018),而口译任务的一个核心原则是最大程度地在译文中复原(restitute)原文信息,因此可以预测:在认知负荷更高的情况下,形容词的加工将比动词受到更大的影响。研究引入了“活动度指数”(activity index)来检验该假设,活动度指数是文本中动词和形容词频率的标准化比率,根据上述依据,它可能是反映不同口译类型的产出过程中认知负荷相对差异的有效指标。结果显示,交传产出比同传产出具有更大的活动度,且在主要的潜在混杂因素(如译文的平均句长、原文的活动度)均得以控制的情况下,该统计性差异仍然显著。进一步的分析发现导致该差异的直接原因是交传产出中形容词频率显著较低,这意味着形容词在交传加工过程中受到了更大程度的“牺牲”。该结果说明,与人们普遍持有的同传比交传压力大的直觉相反,交传加工可能比同传涉及更大的认知负荷。鉴于本论文的语料库设计和背景,这“被低估的”认知负荷很可能存在于交传加工的第二阶段即“重组”产出阶段(reformulation phase),而非包括原文听取和笔记过程的“理解”阶段(comprehension phase)。结合口译的认知负荷模型以及先前研究中基于工作记忆(working memory)理论提出的同传的“认知负荷释放”(cognitive load relief)及交传的“认知负荷累积”机制(Gile,2008,2009;Liang et al.,2017),该结论得到了进一步的阐释。这项研究结合口译过程的视角,引入计量语言学中的一个简单却具有深刻认知内涵的指标去分析真实口译语料,研究结果为同传和交传的加工机制差异提供了新的证据。同时,该研究也首次报告了极端认知负荷所导致的语言加工中的词性偏向现象(lexical category bias),反映了词性分布层面的语言表征对于认知约束的动态适应行为,从一个微观的视角揭示了语言与认知之间的协同机制。作为第一项研究的延续,论文第二项研究(第二章2.2节)系统考察了两类口译产出中的词性序列组织模式,具体采用词性距离(part-of-speech distance)指标展开。词性距离可定义为文本中一个词性单位(如动词)的出现与它的下一次重复(出现)之间的线性距离(Tuzzi et al.,2012;Altmann&K?hler,2015),因而其分布可反映词类在文本中的重复行为(repetition behavior),该行为可能会因同传和交传认知加工机制的差异而呈现出不同的模式。研究结果证实了该假设。首先,对两类口译产出中不同词性距离频率的统计对比显示,同传产出相比交传产出包含更密集的短词性距离,即同传产出中有更多的短距离词性重复。该差异在匹配原文指标后仍然显著,说明主要是源于同传和交传的加工机制差异。两种口译任务在时间约束方面的差异提供了一个合理的解释:相对于交传中时间上相互独立的输入和产出过程,同传的输入和产出环节是并行的,因此同传的原文中的词性序列信息能更大程度地在其译文中保留,而又由于一个语言特异性(language-specific)因素,即中文(原文)比英文(译文)包含更大比例的短词性距离,因此本研究中的同传产出比交传产出保留了更多的短距离词性重复。本研究更主要的焦点是采用了一个统一的、具有普遍语言学阐释依据的分布模型来探索同传和交传产出中的词性序列分布规律。结果显示,两类口译产出中的词性距离总体上都能被“统一的语言长度分布模型”(Popescu et al.,2014b)即齐普夫—阿列克谢耶夫(Zipf-Alekseev)模型良好拟合,而个别词性距离在该模型上的偏离也能结合具体的语言特异性得到充分解释。该结果表明,两类口译产出中的词性序列分布都受到某些一般性规则或力量的支配,其中人类认知的普遍性可能是一个重要因素。而与此同时,研究结果也显示两种口译产出的词性距离分布在齐普夫—阿列克谢耶夫模型的一个重要参数b参数上呈现出系统性差异,即交传组的b参数显著小于同传组。由于b参数的理论构念对应相关的产出过程因素(production-related factors)的影响(而对应语言因素影响的a参数没有呈现显著差异)(Tuzzi et al.,2012;Altmann&K?hler,2015),因此在研究排除主要的潜在混杂变量之后,b参数所呈现的区分效应主要归因于交传和同传的认知加工机制差异。本研究发现了词性序列组织模式在两类口译产出中的一些规律性和特异性,对于两种口译类型的加工特点及差异提供了全新的阐释视角,同时也从另一个语言侧面论证了语言表征对于认知因素的系统适应性机制。此外,这项研究还首次把词性层面的语言序列组织特征的探索拓展到了心理语言学范畴,同时研究结果也反哺了“统一的语言长度分布模型”的实证效度,并丰富了该模型在语言认知加工维度的阐释依据。论文的第三项研究(第三章)主要致力于具体句法层面的口译加工表征。先前研究(Liang et al.,2017)发现同传和交传的认知需求差异导致两类口译产出的整体句法复杂度(global syntactic complexity)差异,但不同的句法结构类型意味着整体视角不足以深入描述句法加工,因为它模糊了不同句法结构之间可能存在的加工差别。鉴于此,本研究开展了更加“局部”的探索,基于本论文口译语料库的依存标注树库(由Stanford Parser 4.2.0自动标注后经人工检查),分别考察了主要的句法结构类型在两种口译产出中的复杂度特征。分析采用平均依存距离(MDD)作为句法复杂度指标,同时也参考了其它依存指标(依存方向、相邻依存的比例、支配词和依存词词性等)。在分析具体句法结构类型时,对原文文本中的整体MDD及相应依存类型的MDD同时进行了统计匹配,以最大程度上减少原文组间差异的影响。研究结果证实了研究假设,即不同的句法结构呈现出不同的复杂度反应,且这些差异化反应不能被主要的潜在混杂因素(如平均句长、原文依存指标)所解释。具体而言,本研究首先成功验证了前述关于同传和交传认知加工机制不同导致两类口译产出呈现整体句法复杂度差异的结论(交传产出复杂度明显低于同传),而后续针对不同句法结构的分析则表明,上述整体句法复杂度倾向并不适用于所有的句法结构,而只对部分句法关系成立。主要的主语结构、定语结构以及句法功能类似于宾语的开放性从句补语结构在同传产出中呈现出更高的复杂度,而主要的(名词性)宾语结构、状语结构及句法功能类似于宾语的封闭性从句补语结构则在两类口译产出之间复杂度相当。参考其它依存指标,并结合从语料中援引的语言实例,对不同句法类型的数据模式进行对比分析。结果表明,口译产出的句法复杂度不仅受制于口译员所面临的认知约束,也同时很大程度上受到不同句法结构之间的差异特别是内在结构性约束(constructional constraints)差异的影响。这种差异可归纳到语言在水平维度上的层级性(horizontal hierarchy),即相对于普通语言学意义上的不同语言单位水平之间的垂直层级性(vertical hierarchy),同一语言单位水平上的个体之间也存在属性层级。语言内部的层级性约束与语言外部的制约因素共同塑造了语言的句法复杂度表征。论文的第四章进一步从三个方面展开了一般性讨论。首先,总结了论文中不同计量指标的数据模式,并结合口译认知负荷模型、工作记忆、句子增量加工(incremental sentence processing)以及句法结构等理论,进一步分析和概括了两种口译任务加工机制的特征和差异。其次,讨论了研究结果对于双语加工以及语言—认知关系的启示。鉴于口译任务与其他双语加工任务所具有的一般性机制(Paradis,2004,p.240;He,2019),口译加工的研究结论可为理解广泛意义上的双语加工提供参考。本研究报告的认知负荷差异导致的词性和词性序列分布的偏向现象以及句法复杂度表征的变化模式也可能存在于其它双语加工环境,因此有望对双语加工的一些普遍性和特异性的探索提供借鉴。同时,本论文的证据也为认识语言与认知之间的关系提供了新的视角,无论是词性、词性序列还是依存句法复杂度的数据模式都一致指向语言表征与认知约束之间的互动协同关系,反映了语言对于认知的根本性的动态适应机制,并且句法层面的证据还表明该适应机制也同时受语言内在属性的制约。最后,对论文的研究方法和思路进行了评估。本论文的结果表明,在基于产出的口译研究中引入过程研究的视角和手段,可以在充分发挥产出导向研究的高生态效度和高计量效应等优势的同时,有效提升研究结果对于口译加工机制的阐释力,从而更好地“逆向还原”口译过程。该思路为系统探究语言与认知之间深刻而复杂的关系提供了广泛的可能性。同时,论文中的文本计量方法在口译加工语境下的应用,也有力地拓展了这些方法的实证范畴和阐释力,表明融合计量语言学和心理语言学的方法和思路能为探索语言的心理机制提供新的动力。本论文的研究结果也为进一步校准口译的认知理论模型提供了可借鉴的依据。论文最后一章回顾了研究要点并概述了研究的局限性以及未来的方向。本论文在产出导向的口译研究范式中纳入了口译的过程视角,采用计量语言学的指标和方法对真实口译语料实行“跨模式”对比分析,并借鉴心理语言学及口译研究等领域的理论进行结果阐释。研究结果不仅说明了两种口译加工机制的一些重要特征和差异,还从多个维度揭示了口译过程中语言行为对于认知约束的适应性机制,该机制对于更广泛意义上的双语加工以及语言—认知关系研究具有启发意义。本论文在此基础上更进一步,将口译句法加工特征的探索拓展到了更加“局部”的层面,结果表明口译认知加工机制的差异所导致的语言特征的适应性变化也同时受到语言内在属性(如句法内部结构约束的层级性)的制约,语言内部与外部制约因素的交互作用决定了某些语言单位或结构比其它的更倾向于适应性变化。可见,“选择性”(selectivity)或者“差异化”(differentiation)是语言对外部制约因素的适应性机制的一个重要特征。这些证据为我们理解协同语言学关于语言的“自组织”及“自管理”能力(K?hler,2005)以及语言是一个“人驱复杂适应系统”的理论(Liu,2018;刘海涛,2021)提供了更为精细的视角。
其他文献
介绍慢性病患者久坐行为的发生情况及危害,并从基于常规手段的干预、基于移动手机的干预、基于可穿戴设备的干预3个方面综述慢性病患者久坐行为的干预措施,对我国久坐行为相关干预研究及实践进行展望,旨在为慢性病患者久坐行为干预提供参考。
截至2020年,我国肥胖率已经超过50%,与肥胖相关的糖尿病及相关代谢性疾病问题已成为困扰我国经济健康发展和国民幸福健康生活的大问题。运动是良医,也是解决肥胖问题的高效手段,针对降低肥胖率,已经采取了很多运动方法,如抗阻运动、有氧运动和专项运动等,但大多存在无法坚持,效率低下的问题。此时,空腹有氧作为一种新方法映入眼帘,国外针对空腹有氧进行了大量的实验研究,并且得益于已经发现的科研结果,空腹有氧在
开展国土空间规划督察可有效推动国土空间规划体系的落地。本文从荷兰空间规划督察的产生与变革入手,对其空间规划督察具体制度安排与制度特点进行了剖析。荷兰空间规划督察整合程度高,部门协作灵活;督察机构独立性强,监督信息公开透明;督察有法可依,法律基础完备。文章最后提出我国可以参考借鉴荷兰经验,通过树立刚弹并济督察思路,拓展督察工具,推进机构独立性以及引导公众参与等措施不断完善,优化我国国土空间规划督察制
从2型糖尿病(T2DM)缓解的定义和标准、超重和肥胖T2DM缓解的影响因素、饮食干预缓解超重和肥胖T2DM的机制、模式类型、效果以及提高饮食干预依从性的策略等方面进行综述,旨在指导超重和肥胖T2DM病人科学、有效的减重,为T2DM缓解提供参考。
研究目的:目前对羽毛球运动员的失误一般分为受迫性失误和非受迫失误,受迫性失误往往是由于运动员受到对手的强力进攻导致,为被动失误。而非受迫失误通常是运动员自身的主动失误,现有的羽毛球运动员非受迫失误研究相对较少,本次研究比较具有创新性地从局次和三维信息的角度对羽毛球运动员非受迫失误特征进行研究,以期为相关学者和运动员提供一些参考。研究方法:(1)文献资料法。根据本次研究的需要,借助中国知网、全国图书
随着立德树人根本任务和核心素养理念的提出并不断深入推行,学校教育教学逐步由重知识传授到强调重素养培养和提升。初中生心理健康问题受到教师的广泛关注,而如何组织开展有针对性、实用性的心理健康教育活动,促进学生身心健康成长,是教师需要思考和解决的问题。本文主要阐述新课改下家校共育改善初中学生心理的重要性,家庭教育和学校教育中影响初中学生心理健康的因素,新课改下初中生心理健康教育与家校共育模式探究,旨在优
为进一步明确山区丘陵烟区田间生产农机适用性的限制因素。以湖北鹤峰农机生产核心示范区为研究对象,对该区域使用率较高农机分型,对生产环节分类,确定农机合理的田间作业路径;对与农机作业相关地块特征值进行测算。通过农机作业参数与田块作业条件匹配度分析,结果显示,影响区域农机机型选配的首要因素是机耕路条件,其次是地块形状和面积,其中,地块形状对轮廓平行移动方式作业农机机型影响较大,地块宽度决定选择农机机型大
陕北民歌作为非物质文化遗产保护教育教学活动的研究对象,以其呐喊狂歌展现了来自远古人类的生命记忆,以其对苦难的记载在民歌中留下生活的烙印,以其对痛苦的控诉、对幸福的讴歌镌刻了时代的印记,以其无处不在的发生发展构成展现如水随形而走的多样姿态,以其强大的生命力量成就了陕北民歌发展的活态传承现状。目前我们正经历着陕北民歌研究的第五个阶段,即多元传承及保护模式、探索模式的形成阶段,在校园传承中关注继承与发展
2021年,浙江省接受国家赋予的努力建设共同富裕示范区的历史任务,以此为契机,提出“山区26县跨越式高质量发展”的战略目标,山区26县迫切需要处理好发展滞后明显、人民收入分配差距大等问题,为高质量发展提质增效。与此同时,近年来中国金融科技发展走上新台阶,逐渐成为经济增长的新动能,发展潜力不断激发,使得数字普惠金融的作用更加明显和提升,金融为民、科技向善的属性进一步显现,而浙江省始终在这一发展上走在
近年来,随着全面二孩政策的出台,二孩家庭逐渐增多,以往以独生子女为中心的家庭结构发生改变,复杂的家庭关系给原有的亲子关系带来了新的挑战,其中父母与“大孩”之间沟通不畅的现象较为常见。已有对于亲子沟通的研究大都是在结构较为简单的家庭中进行,对亲子沟通问题的现状、影响因素等进行理论上的分析,仅针对有问题的家庭成员个体提供服务的研究较多,将二孩出生造成的关系失衡的家庭看做一个系统,通过改变家庭关系来解决