论文部分内容阅读
会话是人们日常生活中极为普遍的语言现象。生活中,当我们需要将大量的原语会话文本通过人工翻译为目的语文本时,难免会费时费力,如对电影、电视的字幕翻译,机器翻译为我们提供了解决此问题的便捷方式。机器翻译历经七十多年的发展,一定程度上克服了传统人工翻译耗费时间与人力的缺陷,为人们解决了一定的不同语言之间的交流问题。然而,目前机器翻译的结果与人工译文相比,仍存在一定的差距。缩小这些差距,使得机器翻译的结果更能为人们所接受,是机器翻译发展最终要达到的目标。自动化、形式化和模块化是机器翻译的三大特点,这意味着机器翻译结果的评价离不开形式化语言,而使机器读懂形式化语言暂时离不开人工辅助。修辞结构理论由William C.Mann和Sandra A.Thompson提出,主要研究语篇的修辞关系,并通过修辞结构树形图进行形式化表达。树形图的描写方式为语篇形式化提供了良好的参考与借鉴。目前,修辞结构理论的应用集中体现于书面语篇。本文借鉴会话语篇中的对话结构分析,对修辞结构理论中原有关系进行补充,从而展开对会话语篇的修辞结构描写。论文选择《老友记》为研究语料,通过人工筛选,共选择50个场景的会话,经过篇位切分,关系识别,刻画出这50段会话的人工译文与机器译文修辞结构树形图,并进行对比。通过对比树形图我们发现,机器翻译错误在图形上共有两种体现,即关系缺失与关系替代。就关系出现的总量而言,人工译文中共出现25种不同关系,总频率为823次;机器译文共出现21种关系,总频率为568次。其中关系缺失为255次,属于20种不同的关系;关系替代仅为11次。50篇场景会话中,仅有一篇的机器译文与人工译文完整匹配。总体而言,机器翻译的结果是可观的。就具体关系而论,“联合”“回应”“回答”及“阐述”的使用频率最高,“证明”“方法”“析取”及“目的”的使用频率最低,这与会话语篇的篇章特征息息相关。另外,基于对比分析的结果,会话语篇的机译错误集中体现于几个方面:省略性回答,主要指一般疑问句的肯否定回答,或应答语副词yes/no;词汇误译,其中包含名词所有格、介词、动词词组与数词误译;语法错误,主要为语态与时态误译及成分残缺;其他错误诸如专业术语误译与英汉语混用等。出现这些错误的主要原因为,人工在进行翻译时会结合上下文、说话人身份、身体语言、场景等因素,而机器翻译还无法将这些因素纳入考量范围。综上,本论文试图通过修辞结构理论在会话语篇分析方面的应用,为会话语篇机器翻译错误评估提供一种语言学方面的参考。