基于排序学习的翻译自动评价方法的研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:carol123450
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,机器翻译自动评价的研究一直是国内外机器翻译界的研究热点。翻译自动评价不仅能够快速的评价机器翻译的质量,研究者们还可以把翻译评价的结果作为反馈信息来调整其机器翻译系统的参数。因此,其研究不仅有一定的直接应用价值,还可以在一定程度上推动翻译理论的研究。本文主要针对现有机器翻译自动评价方法针对句子级评价性能不佳的现状,探索了利用排序学习模型实现高性能的机器翻译自动评价方法。主要研究内容包括以下几个方面:1.总结分析现有机器翻译自动评价广泛采用的几种基于相似度计算方法,并在各种数据集上对这些方法的优缺点进行实验对比。实验结果表明这些方法在总体上性能有所差异,并且在不同数据以及同一数据的不同样本分布上也同样有所差异。2.探究基于排序学习的翻译自动评价方法,并采用最大熵和SVM排序学习方法融合现有的翻译自动评价模型。实验结果表明基于SVM排序学习模型融合的方法能够更好地融合现有的翻译自动评价模型各自的优点,在句子级的评价方面获得更佳的性能。3.提出多特征基础上利用排序学习模型构建翻译自动评价方法。其中多特征来源于两方面,一方面是来自于现有基于相似度的翻译自动评价模型内部的参数,另一方面是引入词性这一浅层语言学特征。实验结果表明基于特征融合的翻译自动评价方法的性能要优于模型融合的方法,词性特征能够有效的弥补现有方法的不足,基于SVM排序学习模型取得了句子级翻译自动评价的最优性能。本文实验采用目前机器翻译自动评价研究中公开的人工评分标准各异、源语言不同而且参考译文数目不一的数据集,本文方法的优越性得到了有效地验证。在2008年NIST组织的第一届机器翻译自动评价技术的国际评测(MetricsMATR2008)中,本文系统获得总成绩第二,并在多项测试中获得第一名的好成绩。
其他文献
编队节点在高速运动状态下,有可能由于受到通信条件的制约或节点意外失效,从而失去与原指挥系统的联络关系。在这种条件下,为了保证节点之间通信畅通,必须在各编队节点间采用
学位
自然语言处理是人工智能和语言学领域的分支学科。在这个领域中探讨如何处理及运用自然语言实现特定的应用。本文提出了一种实现自然语言处理应用的方法,称为面向应用的受限
随着信息技术的发展,越来越多的图像和视频出现在人们的生活中和互联网上。如何有效的管理和组织这些多媒体数据成为一个亟待解决的问题。对多媒体内容进行分析与理解,进而对
随着吸烟人群的增加及环境污染的严重化,慢性阻塞性肺病(Chronic Obstructive Pulmonary Disease, COPD)的发病率越来越高,其早期诊断与治疗方法的研究受到越来越高的重视。
计算机是人类最伟大的科学技术发明之一,其应用已非常普遍,也使得计算机软件的应用也越来也广泛。软件作为信息的载体,包含了许多应用中的私密数据和重大的商业价值。为此,软件安
伴随着Internet的飞速发展,Web上出现了海量的信息资源,如何从这些浩如烟海的信息资源中寻找并获取有价值的信息和知识模式,已经成为信息处理领域的一个亟待解决的问题。本体
传感器技术、无线通信技术和嵌入式技术的进步推动了传感器网络的产生和快速发展。传感器网络作为一个全新的研究领域,向科技工作者提出了大量的挑战性研究课题,而数据管理作为
随着计算机软硬件的高速发展,使得计算机模拟仿真技术也得到了长足的进步。目前这种技术已经广泛应用于航空(海)、医学、电力工业、建筑业、军事等多个领域,尤其在虚拟制造方
蛋白质序列之间的远程同源检测和蛋白质相互作用预测是计算生物学中一个中心的问题。诸如支持向量机(support vector machine, SVM)一类的分类器方法是目前使用最广泛、也是最