【摘 要】
:
神经机器翻译为机器翻译提供了一种全新的方法,在多种语言对上的翻译效果已经超越了统计机器翻译,并逐渐成为当前机器翻译的主流方法。但是神经机器翻译也存在自身的不足,翻译精准度缺失的问题是当前神经机器翻译面临的主要难题之一,在神经机器翻译模型生成的译文中经常会出现错误翻译的现象。本文探索了词义在神经机器翻译中的应用,词义为模型能够正确翻译单词提供了有用的信息。通过对词义的建模,能够缓解传统神经机器翻译模
论文部分内容阅读
神经机器翻译为机器翻译提供了一种全新的方法,在多种语言对上的翻译效果已经超越了统计机器翻译,并逐渐成为当前机器翻译的主流方法。但是神经机器翻译也存在自身的不足,翻译精准度缺失的问题是当前神经机器翻译面临的主要难题之一,在神经机器翻译模型生成的译文中经常会出现错误翻译的现象。本文探索了词义在神经机器翻译中的应用,词义为模型能够正确翻译单词提供了有用的信息。通过对词义的建模,能够缓解传统神经机器翻译模型中存在的错误翻译的问题。主要研究内容包含如下三个方面:(1)本文首先分析造成神经机器翻译中产生错误翻译的原因,并分析不同神经机器翻译模型中错误翻译的情况。进而,本文将单词翻译看作是单词词义的表现形式,通过字典方法、语义消歧方法和随机候选翻译方法为源端单词构造对应的单词词义。(2)一旦获取了单词词义,本文通过三种不同的编码器结构为神经机器翻译模型融入单词词义。Factored编码器采用相加或者拼接词向量的方式直接将单词词义添加入神经机器翻译模型中;Gated编码器采用门机制选择性地控制单词词义进入模型的流量;Mixed编码器将单词与单词词义交替地输入进模型。实验结果显示本文方法在中英机器翻译任务上取得了显著的效果提升。(3)子词化是神经机器翻译系统中用来解决低频词翻译问题的重要手段。为了评估本文方法在基于子词的神经机器翻译模型中的效果,首先提出了获取子词词义的方法,再将子词词义应用于基于子词的神经机器翻译模型中。实验结果表明融合子词词义的神经机器翻译模型也能有效地提升翻译质量。
其他文献
本研究选择海浪河下游为研究区段,根据流域受污染情况设置了10个采样点,于2009年3月至2010年1月采集水及底泥样品,运用常规微生物分离方法等研究方法对该流域水生真菌群落结
移动环境下数据应用的一个重要难题是数据同步过程控制。数据同步过程是指移动客户机与服务器间实现数据的一致性。论文提出了基于时间戳的数据同步模型,详细阐述了各功能部
集团企业若要实现长期稳定的发展,必须注重对现金余额的管理,及时调整现金余额管理策略,使现金在企业集团内部形成良性循环。企业集团要对现金余额管理给予高度的重视,由于现金在
目的探讨中药汽浴疗法联合手法整复治疗退行性腰椎滑脱的效果。方法将149例退行性腰椎滑脱症患者随机分为观察组和对照组。观察组患者采用中药汽浴疗法联合手法整复治疗,对照
介绍了热敏变色材料的种类及其变色原理,从印花、染色和纤维技术等方面叙述了热敏变色纺织品的制造方法.
从保护受害人合法权益的角度来看,我国目前环境侵权责任制度无法实现环境公平正义。要使环境侵权损害赔偿得以真正实现,必须构建综合救济途径。在制度建设上,主要是完善侵权责任
在科技革命的智能化时代背景下,各种智能产品不断涌现,如:智能家居、智能工厂、智能交通等,人机交互的方式不断革新,从键盘、鼠标到触摸屏,再到人脸识别、手势识别,人机交互方式正在向着智能化、非接触化趋势发展。手作为人体最灵活、最易控制的器官,在人机交互中可以根据不同的姿态传达不同的信息,基于手势识别的非接触式人机交互一直是研究热点,不管是穿戴式手势识别还是传统计算机视觉的手势识别都做出了相当好的成果,
在大数据时代和未来的人工智能时代,受制度因素和技术因素的影响,社科类高校学报将会在出现管理变革和运行转型。在管理方式上,从行政化管理发展为扁平化管理,再到网络化管理
研究拉萨SOS儿童村儿童的体格状况和生长发育情况。调查结果发现儿童的身高、体重、胸围和坐高的发育符合一般的生长发育规律,随着年龄的增大而增加。与1982年拉萨市城区儿童
2016年是"十三五"规划的开局之年,总结分析"十二五"收官情况,探讨我国现存的执业药师资源分布不均、相关法律不健全、执业药师的社会认知度低、执业药师严重短缺、药师资格认