论文部分内容阅读
近年来,机器翻译自动评价的研究一直是国内外机器翻译界的研究热点。翻译自动评价不仅能够快速的评价机器翻译的质量,研究者们还可以把翻译评价的结果作为反馈信息来调整其机器翻译系统的参数。因此,其研究不仅有一定的直接应用价值,还可以在一定程度上推动翻译理论的研究。本文主要针对现有机器翻译自动评价方法针对句子级评价性能不佳的现状,探索了利用排序学习模型实现高性能的机器翻译自动评价方法。主要研究内容包括以下几个方面:1.总结分析现有机器翻译自动评价广泛采用的几种基于相似度计算方法,并在各种数据集上对这些方法的优缺点进行实验对比。实验结果表明这些方法在总体上性能有所差异,并且在不同数据以及同一数据的不同样本分布上也同样有所差异。2.探究基于排序学习的翻译自动评价方法,并采用最大熵和SVM排序学习方法融合现有的翻译自动评价模型。实验结果表明基于SVM排序学习模型融合的方法能够更好地融合现有的翻译自动评价模型各自的优点,在句子级的评价方面获得更佳的性能。3.提出多特征基础上利用排序学习模型构建翻译自动评价方法。其中多特征来源于两方面,一方面是来自于现有基于相似度的翻译自动评价模型内部的参数,另一方面是引入词性这一浅层语言学特征。实验结果表明基于特征融合的翻译自动评价方法的性能要优于模型融合的方法,词性特征能够有效的弥补现有方法的不足,基于SVM排序学习模型取得了句子级翻译自动评价的最优性能。本文实验采用目前机器翻译自动评价研究中公开的人工评分标准各异、源语言不同而且参考译文数目不一的数据集,本文方法的优越性得到了有效地验证。在2008年NIST组织的第一届机器翻译自动评价技术的国际评测(MetricsMATR2008)中,本文系统获得总成绩第二,并在多项测试中获得第一名的好成绩。