字符级神经网络机器翻译

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:qweasd123qweqwe
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
*以下内容是根据英文摘要,经我们自己的神经网络机器翻译系统翻译而来。随着全球通信的增加,语言障碍成为一个亟待解决的问题。在目前的情况下,机器翻译是克服障碍的有效方法。机器翻译起源于17世纪,在19世纪后期作为统计机器翻译而发展起来。随着神经网络的发展和深度学习技术的发展,机器翻译也采用了这些技术,并取得了新的进展。神经机器翻译的目的是建立一个单一的神经网络,可以联合训练,最大限度地实现翻译性能。具有注意力的编码解码器结构实现了与现有的基于短语的系统相比的翻译性能。然而,大量词汇的使用已经成为神经机器翻译的瓶颈之一。例如,词级的神经机器翻译在捷克语言中表现更差。因为捷克语是斯拉夫语的语言,不仅有丰富而复杂的变化,而且具有丰富的形态学形态。为了更好地处理这些语言,我们提出了一种高效的字符级的神经机器翻译。介绍了一种分层编码器和层次解码器,构成了深层字符级的神经机器翻译(DCNMT)。分层编码器从编码字符序列开始,获得单词级表示,然后从单词级别学习语义特征。分层解码器在获得单词级别表示后,在字符级解码。这样一个深度的模型有两个主要的优点。它从根本上避免了大量词汇问题;同时,它比传统的基于字符的模型快得多。更有趣的是,我们的模型能够像人类一样翻译拼错的单词。由于许多语言起源于一种共同的祖先语言,相互影响,因此,这些语言之间的相似性必然存在,如词汇相似性和命名实体相似性。我们进一步利用这些相似性来提高我们的字符级神经机器翻译中的翻译性能。具体地说,我们引入了一种注意力的注意机制,它直接引导源侧字符的信息直接流向目标侧。利用这种机制,当单词类似时,将基于源边字符的表示形式生成目标侧字符。例如,我们提议的神经机器翻译系统通过注意力注意机制(AvA)传递英语单词‘system’的字符级信息,从而生成捷克单词‘systém’。因此,我们的方法不仅能够达到一个突出的翻译效果,而且能够显著降低模型的大小。我们在英语-法语和英语-捷克的翻译任务上训练这些模型。我们与各种强基线进行比较,包括RNNsearch、bpe2char模型、char2char模型和混合模型。通过定量分析和定性分析,评价了该方案的有效性和高效性。
其他文献
目的本研究旨在检测正常妊娠与稽留流产患者血清脂联素、HCG、孕酮及D-二聚体水平的差异,从而探讨血清脂联素、HCG、孕酮及D-二聚体水平检测与早期妊娠不良结局的关系。方法
本论文针对纳米复合防腐剂的抗流失性、橡胶木的耐腐性和尺寸稳定性进行改性研究,分别探索了纳米复合防腐剂与酚醛树脂、丙二醇、丙烯酸树脂、胶乳和单宁-硼酸的协同作用,并
目的通过外科手术联合正畸牵引治疗替牙期含牙囊肿内牙根未发育完成的埋伏阻生上颌中切牙,以同颌对侧正常同名牙作为对照,比较治疗前后埋伏阻生牙牙根、牙槽骨及牙髓的变化,
随着通信技术的发展与通信业务需求的日益多样化,越来越多的无线接入技术相继出现并得到应用。多种无线网络互补共存,形成了异构无线网络融合的新局面。认知无线电技术对多个空中接口和协议的支持性为多模终端在异构无线网络之间进行垂直切换提供了技术支持。由于不同类型的网络采用的技术和对业务的支持能力等方面具有很大的差异,且不同的业务对网络的性能要求也不尽相同。如何根据不同接入网络的性能和状态,为终端选择合适的接
我国是制造业世界第一大国,磁性材料的生产企业众多,但是对于磁材产品的质量检测技术相对落后,无法满足精准率与效率的要求。随着机器视觉技术的逐渐成熟,其高效率高精度的优
研究目的缺血性脑卒中(Ischemic stroke)是严重威胁人类身心健康的脑血管疾病,发病率一直高居不下,目前仍处上升趋势。众所周知,缺血性脑卒中除溶栓外无特异有效的预防以及治
目 的:芪蓟肾康颗粒剂是导师张君教授在三十余年的临床治疗儿童肾脏病的经验上结合古经方化裁而来。本实验研究对象为肾小管上皮细胞,运用转化生长因子β 1诱导肾小管上皮细
拥有3D结构的FinFET不仅本身具有较低的阈值斜率,同时,还有可以加强栅极电压控制、减少短通道效应、提高能量效率、降低栅极延迟等一系列的优点,让它成为新一代电子电路中元
本文主要讨论了融合型细分格式的一般框架问题,其主要内容包括四点三重细分框架的构造、融合型细分格式的性质分析以及从Laurent多项式的构造角度给出一类融合型细分格式。第
在异构无线网络中,干扰管理和资源分配问题非常重要。传统资源分配是基于完美信道状态信息设计,但是由于信道随机性、估计误差和链路时延等因素的影响,在实际通信系统中很难获得实际的时变信道参数。因此,在考虑非完美信道状态信息下(即,参数不确定性),如何实现鲁棒资源分配具有十分重要的理论意义和现实价值。本文研究不同场景下的能效优化算法来提高异构无线网络的能量效率,以期达到在降低传输功率开销的同时提高整个系统