面向统计机器翻译的解码算法的研究

被引量 : 0次 | 上传用户:pxghq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
统计机器翻译发展到今天,其模型已经经历了词模型,短语模型,形式句法模型,树-串模型,串-树模型的变化,目前还有很多学者在尝试建立树-树模型。如此繁复多样的模型,其解码器也各不相同。本文主要描述了一种基于k-best句法分析技术的统一解码算法。我们通过对各种机器翻译模型进行改造,将它们归纳到同步上下文无关文法框架之下,利用一种对于单语k-best句法分析算法,对源语言端进行句法分析。由于同步方法的规则是双端的,所以目标语言端的分析树会随源语言端同步生成。我们利用对数线性模型融入多种特征,利用这些特征值的对数加权和作为同步上下文无关文法的规则得分,在对源语言端句法分析中,这些得分是随分析树的生成而累加的,因此我们可以根据最终在分析树的根节点中存储的得分最高的前k个推导,找出对源语言来说得分最高的k-best翻译结果。我们也介绍了目前主流的,针对短语模型的,基于有穷状态自动机的解码算法,并比较了它和统一解码算法在短语模型上的表现,实验证明,在使用同样短语模型的情况下,统一解码算法的表现和基于有穷状态自动机的解码算法的表现接近。此外,我们也利用统一解码器对多种模型进行了解码,实验证明,在相同的语料上训练模型,对于加入越多先验知识的模型,其解码效果越好。
其他文献
随着中国经济的快速发展,能源紧张、环境污染、食品安全等社会经济问题逐渐成为公众关心的话题,为此中国企业积极投入公益活动,主动承担起社会责任,从而为企业创造了差异化的
温州市是我国地质灾害频发地区之一,滑坡、泥石流等地质灾害给当地人民的生命财产造成了巨大的损失。本研究在温州市各区县地质大调查的基础上,以温州市地质灾害预测预警系统
本文根据数控机床主轴驱动的要求以及永磁同步电机发展的现状,提出了用永磁同步电机驱动数控机床主轴这一崭新的课题,并围绕主轴驱动永磁同步化的主要障碍——永磁同步电机的
手性也称为不对称性,是自然界最本质的属性之一。手性物质在日常生活中有非常重要的作用,手性药物、手性农药和手性材料越来越广泛地应用到各个领域中。具有手性的芳香醇分子
由于前期对马克思主义教条化的理解,我们现在对这一意识形态形成了一种“集体无意识的”拒斥情绪,而且要扭转这种“偏见”也很困难。但马克思主义哲学果真失去它的魅力了吗,
随着计算机和通信网络逐渐深入人们的生活,越来越多的人开始关注信息的安全。密钥协商协议在通信系统中为通信的参与者提供身份认证,并为参与者生成一个用来加密传递消息的临
目的多种癌症可以发生骨转移,如乳腺癌、肺癌、肾癌,肿瘤细胞、成骨细胞、破骨细胞和骨基质细胞分泌的细胞因子相互作用共同促进了肿瘤骨转移的形成和发展。肿瘤细胞释放的某
针对承压水作用下基坑底隔水层为黏性土体的情况,设计突涌离心模型试验,分析不同开挖深度和水位作用下围护墙的弯矩、水平位移与稳定性,观测坑底土体隆起和突涌破坏状态。试
随着汽车工业现代化进程的加快,汽车配件生产线的现代化变得愈加重要。点火线圈作为汽车点火控制系统的重要组成部件,直接影响汽车的动力学性能及环保性能。近年来日臻成熟的
本文借助组织运行系统分析模型,识别出建筑企业项目治理的十二个驱动因素包括:信息对称、目标匹配、知识共享、责权界定、人员配置、绩效薪酬、设备材料、营销体系、品牌建设