论文部分内容阅读
人类社会是一个由多种文化组成的复杂整体,各种文化间的互相影响和渗透促进了人类社会的进步和发展。在当今的信息社会中,各文化间交流的主要载体是语言,而不同语言之间的翻译成为文化交流过程中的关键所在。面对海量的多语言信息,传统的人工翻译已经远远无法满足需要,因此能够实现自动化的自然语言翻译的机器翻译技术在过去十几年中一直是人工智能领域研究的一个主要热点。在机器翻译研究中,翻译系统的评价方法是一个关键环节,它对于机器翻译研究具有着非常重要的意义。评价方法可以对翻译系统的性能作出评价,指出存在的问题,指导系统的研发。准确的评价方法是系统研发过程的主要依据,是推进机器翻译系统发展的主要动力之一。可以说,没有有效的评价方法,就没有机器翻译系统的发展。经过近几年的发展,机器翻译自动评价方法的研究在世界范围内取得了丰富的成果,这些成果都主要体现在基于系统译文和参考译文的宏观相似度的评价方面。目前,基于宏观相似度的评价方法虽然取得了一些进展,但是其评价性能仍然有待进一步提高。这里的“宏观”指的是将一个句子,一篇文章乃至一套语料作为一个完整的整体进行评价,给出唯一的一个评价分数,该分数体现了机器翻译系统的整体性能。宏观评价是一种黑箱的评价方法另一方面,随着机器翻译系统变得越来越复杂,传统的宏观评价方法已经难以满足当前机器翻译研究的需要,研发者们需要能够提供更加丰富信息的微观自动评价方法。这里的“微观”指的是对语料中的片段或者机器翻译系统的某方面功能的评价。微观评价是一种白箱的评价方法,在本文中,我们进一步的根据其特点,将提出的微观评价方法称为“诊断”方法。基于这些问题,本文旨在进一步提高宏观自动评价方法的性能,同时面向机器翻译的微观评价,提出有效的机器翻译自动诊断方法。对基于字符串相似度的宏观评价方法,参考译文的覆盖度扩展以及面向单语和双语的自动诊断方法等关键技术进行研究。1.基于不连续N元子串的宏观自动评价。基于字符串相似度的宏观自动评价方法以其快速稳定的性能和广泛的适用性得到普遍接受。本研究着眼于提高基于字符串相似度的评价方法的性能,在对现有方法的优势和不足的分析的基础上,提出了一种新的基于不连续N元子串的评价技术。新的方法在不连续2元子串方法的基础上进行了扩展,其中包括了选择更宽的单元长度和多重的相似度统计。另一方面,基于SVM的机器学习方法也被引入到新方法当中,用于调整多重统计在整体评价中的权重。新的方法在性能上得到了提高。该研究的成果在2008年NIST评测中取得了两个第一和一个第二的好成绩。作为宏观评价方法的一种应用,本文还将宏观评价指标引入机器翻译译文融合方法。机器翻译中的译文融合技术是近年来备受关注的一个新课题。随着不同类型的机器翻译系统的不断涌现,研究者们开始尝试通过译文融合技术来整合不同系统的优势能力。作为宏观评价方法的一个应用,本研究着眼于利用翻译系统的宏观评价指标来指导译文融合,实现译文融合技术在鲁棒性和有效性上的平衡。该研究的成果在2008和2009年的国内评测中均取得了最佳成绩。2.基于句法信息的参考译文扩展。参考译文是自动评价方法的关键因素,参考译文的语言学覆盖度直接影响着评价的质量。本研究着眼于自动化的提高参考译文的语言学覆盖度。本文在不依赖于额外的语言学数据的情况下,实现了参考译文的扩展,并且在参考译文中实现了对不同层次,不同尺度的片段的替换。基于自动扩展的参考译文集合,宏观自动评价方法的性能得到了进一步的提高。3.基于单语语言学检测点的自动诊断方法。机器翻译的微观评价,或称诊断方法是自动评价方法中的全新课题,在国内外受到普遍重视,但是尚处于起步阶段。本研究着眼于提出完整的,全自动的机器翻译诊断体系。该体系从单语的角度,对机器翻译系统在不同重要语言现象上的翻译能力予以评价,为翻译系统的研发者提供多角度,多层次的诊断信息,为实现有针对性的系统开发提供有力的帮助。该研究的成果已经被国内的机器翻译评测选用为评价指标之一。4.面向双语转换的自动诊断方法。机器翻译的根本任务是实现从源语言到目标语的转换。双语转换的质量是机器翻译的根本问题。在单语诊断方法的研究基础上,本研究旨在实现面向双语转换的自动诊断系统。新的诊断系统通过直接对双语转换进行识别,获取,分类和统计来实现对翻译能力的更为直接的评价。另一方面,本研究还首次提出了翻译错误成因的自动分析以及针对词序转换错误的专门分析等新的方法。综上所述,本文的主要贡献在于通过新的相似度评价手段,机器学习方法以及参考译文的扩展,提高了宏观自动评价方法的整体性能,为宏观评价方法中的若干关键技术提供了新的思路。在微观评价的自动诊断技术领域,做出了开拓性的工作,分别从单语和双语的角度,提出了较为完整的自动诊断体系,为机器翻译的研究者提供了全新的评价方法。新的诊断方法一方面促进了机器翻译研究的发展,另一方面,也为今后的微观评价研究提供了借鉴。