引入多策略阴阳性信息识别的英德神经机器翻译研究

来源 :厦门大学 | 被引量 : 0次 | 上传用户:pkpm1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,作为自然语言处理热门方向之一的机器翻译获得了飞速发展,近些年机器翻译基础模型的效果也都在不断提升,如Transformer模型就到达了一个很高的翻译水平。但由于神经网络模型在训练时只集中关注平行语料之间的相关信息,而不能获取句子内的潜在语法信息。所以,机器翻译对于缺乏句内潜在信息的词汇翻译处理能力差,甚至会漏翻部分词语。如英德翻译中,由于英语没有阴阳性信息,神经机器翻译模型也无法捕获英语中潜在的阴阳性信息,因此在翻译德语时对有阴阳性信息的词容易错误翻译。如果能有效的解决英译德过程中阴阳性信息缺乏的词汇翻译问题,将会进一步提升英德机器翻译模型的表现。本文提出了三种在英语中预测阴阳性信息的方法。一是利用知识图谱获取英语阴阳性信息的方法,其主要依据是通过英文句子中的人名链接到知识图谱中获得人名的性别,根据获得的人名性别给句内单词赋予相关的阴阳性。二是利用篇章信息中人称代词及指代消解结果获取阴阳性信息,在英语中人称代词是有性别区分的,且人称代词指代的人名在其前文,所以可通过人称代词及其指代消解结果获得阴阳性信息。三是通过双语平行语料训练阴阳性序列标注模型来获取阴阳性信息,在英德平行语料中德语含有阴阳性信息而英语中没有,因此可以从德语中获取阴阳性信息,通过英德对齐信息将德语阴阳性赋予给英文句子,同时利用获得的英语句子及其阴阳性序列标注来训练一个英语阴阳性序列标注模型,以自动获得英语的阴阳性序列标注。通过多个策略获得了阴阳性信息之后,再将阴阳性信息与机器翻译模型进行有效的融合。本文首先介绍了融合单来源阴阳性信息的基本方法,在其基础上提出了层级混淆方法来融合多来源的阴阳性信息,并训练了层级混淆神经机器翻译模型进行英德翻译任务。融合单来源阴阳性信息的实验结果说明,单个来源的阴阳性信息能对提升英德的翻译提供帮助。同时,层级混淆神经机器翻译模型实验相对融合单来源阴阳性信息实验的结果更佳,说明层级混淆方法能有效综合多来源的阴阳性信息,提升英德机器翻译实验的效果。
其他文献
社会支持理论自从上世纪七十年代以来渐趋成熟,在线社群中的社会支持伴随互联网诞生初期便已出现,迄今已经随在线社交的发展呈现出不同类型的社会支持,实现对现实社会支持的“替补”。本研究以豆瓣平台“985废物引进计划”在线社群为研究对象,运用网络民族志中的参与式观察与访谈法搜集资料,收集了207份网络发帖与21份访谈文本,探究“985废物引进计划”小组成员选择寻求网络中社会支持的动机、网络中社会支持现状、
本文在结合我国实际国情与法律规制的基础上,分析同人作品在我国现行法律状况以及司法实践中的适用问题,同时借鉴域外最具有代表意义的国家,包括日本与美国对同人作品的具体法律措施。通过明确同人作品享有著作权保护正当性的前提下,划分其作者的权利义务范围以及保护原则,以协调与原作品之间发生的权利冲突,同时得出文学虚拟人物角色可著作权性与侵犯原作品保护作品完整权的标准。进一步构建非商业性与商业性同人作品的许可模
随着“乡村振兴”和“文化复兴”的发展,越来越多的人关注到乡土建成遗产的保护和利用,以传统民居为主的展览馆改造更是成为建筑活化的热门话题。但在改造实践和参观体验中也发现一些例如展厅效果不佳、流线混乱等问题,影响了展览教育的效果。基于此,本研究通过探讨传统民居的展览馆改造策略,借助空间句法的空间解析方法,试图解决传统方式下的改造设计困境与难点,优化设计策略,以提出基于空间句法的传统民居展览空间优化策略
大数据时代,作为处理和存储数据的主要平台,分布式存储系统需要应对海量的数据。随着规模的增大,分布式存储系统会出现故障,进而损坏数据,甚至造成数据永久性丢失,通常采用高存储效率的纠删码机制来防范故障。然而纠删码系统面临挑战:一方面,纠删码重构时间长,而且系统中多节点失效场景频繁发生,二者都将增加数据丢失的概率,要求分布式系统具有更高的恢复性能;另一方面,数据的随机布局容易导致重构时各个节点的重构负载
表面拉曼增强散射(SERS)作为一种高灵敏的检测工具,具有快速,无创且精准度高的特点,检测限可达到单分子水平,已经广泛应用于国防安全、医药科学、生命科学、食品安全和环境保护等领域。SERS有两种增强机制,分为电磁场增强机制(EM)和化学增强机制,目前基于SERS大部分的研究集中在贵金属纳米材料为基底的电磁场增强机制,对电磁场—化学复合增强机制的研究还非常少。纯的碳基材料作为SERS基底的机制为化学
随着全球经济发展趋势不断深入以及全球金融市场制度改革等工作的推进,国内金融市场业已实现了前所未有的开放,各个银行之间的竞争逐渐趋于白热化,用户资源对于银行而言起着越来越关键的作用。越来越多样化形式的用户诉求,也对现阶段银行业提出了更多的要求。农商银行X支行始终秉持为用户提供全面服务的理念,将为用户带来更为系统性高质量的服务作为其经营宗旨,试图为用户带去更为高质量以及高规格的服务内容。越来越多的银行
目前在会话型推荐系统问题上,主要使用马尔可夫链与循环神经网络的推荐模型,但是前者适合较短的序列数据并存在独立性假设,后者存在冷启动的问题。序列数据可以转化为图结构数据,而图神经网络能够处理复杂的图结构数据,同时可以克服独立性假设和冷启动的问题,因此研究人员提出利用图神经网络模型来提升推荐效果。本文创新性地提出了一种改进的图神经网络推荐模型——图神经网络融合图嵌入模型。本模型根据用户的会话信息构建图
互联网技术的高速发展带来了教学信息化,包括大规模在线开放课程(Massive Open Online Course,MOOC)在内的线上教学模式,既有作为补充和传统线下教学结合使用,也有单独使用供学生自学。在线课程包含的资源丰富,包括课件、音视频、讨论区等,其中最为基本的是课程音视频资源。教学视频的录制环境通常和线下教学不同,因此部分教学视频中教师缺少感情变化而难以吸引学生。对于在线课程视频的评价
当前乡村地区的发展面临巨大的机遇,国家政策扶持增加、社会关注日益提升。另一方面,受制于不同参与主体的不同动机、意识、水平,各地区村落保护发展效果不一。村落发展正在经历不可逆的试错阶段,试错成本高,有待总结较为成熟的建设经验。院埕空间的营造是闽南地区乡村空间更新的重点,但因诸多原因,表现出以下几点问题。一是项目缺少对空间需求的挖掘及应对,建成后无人问津,缺乏活力、二是项目缺乏地域文化的深入挖掘,对村
培养良好的学习态度能帮助学生形成可持续发展的能力。因此,培养积极的物理学习态度对学生的长期发展意义深远。本文主要通过问卷调查了解初中学生物理学习态度的现状,并在任教班级中进行物理学习态度的培养实践研究,总结了有效改善学生物理学习态度的教学策略,在研究过程中关注了特殊案例的变化发展。本文主要做了以下工作:⑴为了解初中学生的物理学习态度,编制了教师和学生访谈的提纲。根据教师、学生访谈的内容以及查阅现有