论文部分内容阅读
神经机器翻译技术的快速发展使得机器翻译质量显著提升。尽管如此,当前的神经机器翻译质量仍未达到职业译者的水平。为进一步提升机器翻译的输出质量,对机器翻译输出结果进行编辑修改的生产方式成为翻译行业广泛应用的服务。机器翻译推动的翻译行业变化促使翻译教育界开始思考在翻译培训课程中引入神经机器翻译,以帮助学员更好地适应翻译行业的发展与要求。然而,机器翻译译后编辑与传统翻译过程不同。译后编辑者需要对良莠不齐的机器翻译输出结果进行编辑修改。虽然机器翻译译后编辑因为其快速、高效、节约成本的特性在翻译行业中得到了广泛应用,但其面向翻译学员是否可用目前仍是一个悬而未决的问题。可用性是人机交互研究领域的一个重要概念,指的是用户在使用某一系统、产品或服务时达到特定目标的效率、有效性和满意的程度。可用性理论强调以用户为中心。面对同样的技术、产品或服务,用户的使用目的不同,可用性评估标准也不同。神经机器翻译译后编辑在教育场景中的可用性评估需要分析学员在译后编辑过程中解决问题的效率、有效性和满意度。然而,当前国内外关于神经机器翻译译后编辑的研究主要集中于翻译行业视角下其与纯人工翻译或其它机器翻译系统译后编辑的产出和质量对比,而从人机交互角度分析教育场景下译后编辑面向翻译学员的可用性还缺乏系统性研究。翻译学员在译后编辑过程与纯人工翻译过程中的认知努力和产出质量是否存在差异,翻译学员是否具备译后编辑模式下的问题解决能力,以及机器翻译译后编辑课程该如何设置等问题尚待解答。本研究在传统可用性评估理论框架的基础上,提出适用神经机器翻译译后编辑的可用性评估框架。翻译学员的翻译效率、翻译有效性和满意度作为可用性评估参数。翻译效率的测量指标包括翻译时间、体力消耗和认知努力。翻译有效性的测量指标包括翻译准确度、翻译流畅度及问题解决能力。满意度则包括学员使用译后编辑的易用性和有用性感受。研究以翻译硕士研究生和语言类本科生为研究对象,选取科技类文本三篇,翻译方向为英译汉,具体为人工翻译文本(H)、译后编辑文本(P1)和译后编辑文本(P2)。通过文本阅读难度指标和人工评审相结合的方式控制源语文本复杂度,得出H和P1的源语文本复杂度相当,P2难于P1。研究方法采用定性和定量相结合的混合方法,利用键盘记录、眼动追踪、问卷调查和访谈等多元互证的方式收集可用性数据,以R语言数据统计包为分析工具。为了探明神经机器翻译译后编辑方式面向翻译学员是否可用及如何用的问题,本研究在可用性评估框架的指导下,提出如下具体研究问题:(1)在翻译效率上,翻译学员的译后编辑过程是否比人工翻译更为省时省力,不同文本复杂度的译后编辑效率差异如何?(2)在翻译有效性上,翻译学员的译后编辑质量是否高于人工翻译,不同文本复杂度的译后编辑纠错差异如何?(3)翻译学员的问题解决能力怎样,翻译经验在问题解决过程中的作用体现如何?(4)翻译学员对机器翻译译后编辑的使用态度如何?研究结果发现:(1)对于翻译学员来说,译后编辑比人工翻译更为省时、省力,也更能减少认知努力;在人工翻译中,本科生比翻译硕士生需要花费更多的时间和认知努力,但在译后编辑任务中两组学生之间并没有表现出显著性差异;此外,相较于翻译硕士生,本科生在人工翻译中的认知负荷感受更为一致。(2)在翻译的准确度和流利度上,学员的译后编辑质量明显优于人工翻译;在人工翻译中,本科生的人工翻译质量显著低于翻译硕士生,但两组学生的译后编辑质量并没有显著性差异;错译是人工翻译和译后编辑中典型的错误类型,衔接是人工翻译中的重要错误类型,语序则是译后编辑中的重要错误类型;尽管P2相较于P1在源语文本上更为复杂,但P1的纠错数量低于P2,这表明错误类型可能是衡量译后编辑难度的一个重要指标。(3)在问题解决的三个阶段中,计划策略与翻译质量在人工翻译模式中呈显著性正相关关系,而监控和修改策略与翻译质量在人工翻译和译后编辑中呈现出较为混合的关系。总体上翻译学员的问题解决能力较弱,翻译经验在译后编辑中的影响并没有像人工翻译中那样显著。(4)学员对使用神经机器翻译普遍持积极的态度,并表现出学习译后编辑和相关知识的强烈愿望。研究结果表明尽管神经机器翻译译后编辑可以提高学员的翻译速度、翻译质量以及减少学员的认知努力,但学员在人工翻译和译后编辑中的问题解决能力并不尽如人意。换言之,学员的译后编辑质量高于人工翻译质量,究其原因可能主要得益于较好的机器翻译产出质量而不是学员自身的问题解决能力。因而,提升学员的翻译能力仍应是未来翻译教学的重中之重。机器翻译译后编辑质量受到众多因素的影响,诸如译后编辑者的翻译能力、机器翻译输出质量、涉及的语言对和翻译文本等。译后编辑课程可在科学合理设计的前提下作为选修课程提供给翻译硕士高年级学生。此外,译后编辑能力的培养应更多地关注机器翻译错误类型。鉴于神经机器翻译在翻译行业中的广泛应用,有效利用神经机器翻译已成为翻译教育领域不可回避的课题。尽管研究就神经机器翻译译后编辑面向翻译学员的可用性评估取得了一些初步性结论,但囿于样本大小,翻译文本类型及实验生态效度等,研究结论具有一定的局限性。合理使用机器翻译译后编辑是一个相当复杂的问题,需要更多的后续研究。未来将重点在不同文本类型选择上和课堂教学实践上进一步探索相关研究。本文在研究内容、研究方法和理论应用上具有一定的创新性:内容上,神经机器翻译在翻译技术教育领域是一个新生概念。神经机器翻译译后编辑的可用性评估主要通过翻译模式、译后编辑文本复杂度和研究对象三个层面的比较:即相同文本复杂度的纯人工翻译与神经机器翻译译后编辑比较;不同文本复杂度的译后编辑比较;以及翻译硕士与语言类本科生的比较。在现有研究基础上本文进一步探究了翻译学员在人工翻译和译后编辑过程中的认知努力和质量差异,明晰了翻译学员的译后编辑质量提升来源问题(取决于机器翻译的输出质量还是翻译学员自身的问题解决能力)。研究结果可为高校和管理机构评判机器翻译可用性提供教学上的参考依据。方法上,传统意义上的可用性评估常为单一的问卷调查法或过程记录法,本文采用眼动追踪、键盘记录、问卷调查及访谈相结合的混合方法多元互证,确保了研究结果的信度和效度。理论应用上,基于神经机器翻译特征和翻译学员特性提出的神经机器翻译译后编辑可用性评估框架是将人机交互研究中的可用性评估理论引入教育场景的探索。在传统可用性评估框架中增加问题解决维度是对新兴技术融入教育场景中的可用性考量,研究测量指标的细化可为人工智能时代同类相关技术的可用性研究提供参考。