词对齐相关论文
[目的]针对古汉语领域同义词自动抽取研究较少以及现代汉语同义词抽取方法在古汉语不适用的问题,提出一种无监督抽取古汉语同义词......
本文提出了一种基于词对齐的双语组块对齐的方法.它利用已有的词对齐信息和英语组块识别结果,进行汉语组块的识别和双语组块的对齐......
针对专利文献句子偏长的特点,本文尝试将统计机器翻译中的训练语料进行子句切割获取双语的子句序列,再采用统计和规则相结合的策略来......
双语语料库词对齐研究对于自然语言处理的许多应用具有重要意义.本文在对基于统计和基于词典的词对齐方法进行实验分析的基础上,提......
近年来,系统融合成为机器翻译领域的一个研究热点。系统融合研究如何充分利用各种不同机器翻译系统的优势来提高翻译的性能。目前......
双语对齐是机器翻译研究中一个重要的问题,而词汇级对齐是各种粒度的对齐的难点。本文提出了一种基于双语词典、语言学知识以及统计......
近年来,系统融合方法逐渐在机器翻译领域受到重视。系统融合可以综合利用不同翻译系统的优点,缓解数据稀疏,选择最佳译文,从而提高机器......
机器翻译是自然语言处理的一个范畴,它是利用计算机把一种自然源语言转变为另一种自然目标语言的过程。机器翻译技术的实现主要分为......
长期以来,机器翻译系统都是以词为语言翻译的基本单位。人类自然语言中词的使用非常灵活,在机器翻译处理中有很大的歧义性,这是导致机......
在自然语言处理的诸多领域的研究中,双语语料库的重要作用逐渐显现出来。在不同的应用中,需要不同粒度的双语对齐的语料库和相应的双......
随着互联网的迅猛发展和信息的国际化,对于不同语言文本内容的理解和传播成为了人们的强烈需求。机器翻译这个古老的课题在这样的......
目前,基于统计的方法在机器翻译领域内占据着主导地位,出现了多种不同类型的统计机器翻译系统,如基于短语的系统、基于层次短语的......
随着深度学习的快速发展,基于神经网络的蒙汉机器翻译质量也有很大改善。本文针对机器翻译技术,对蒙汉机器翻译展开研究。由于蒙汉......
近年来,随着生物医学实验方法的变革,相关实验数据和文献资料呈现指数级的增长,如何从规模庞大的科学文献数据中快速有效地抽取出......
双语词对齐是自然语言处理技术中一项重要的工作,词对齐目的是在句子级互相翻译的两种语言文本中找出词汇级的对应映射关系,词对齐......
对齐的双语语料在机器翻译、词义消歧和双语词典编撰等领域都非常有用,语料对齐的单位由大到小有篇章、段落、句子、短语、词等不......
跨语言交流的需求越来越大,如何低成本、高效率的解决不同语言之间的交流障碍便成了一个难题。针对该问题,机器翻译便应运而生。目......
汉语缩略语在现代汉语中被广泛使用,其相关研究对于中文信息处理有着重要的意义.本文提出了一种从英汉平行语料库中自动提取汉语缩......
词对齐是目前主流的统计机器翻译系统必备的模块,而IBM模型是词对齐最常用的模型,但是IBM模型不允许源语到目标语的一对多词对齐,这......
短语对抽取是基于短语统计机器翻译方法的关键技术。当前广泛使用的Och提出的短语对抽取方法,过于依赖词对齐结果,因而只能抽取与......
该文提出了基于二部图的词对齐模型:利用二部图为双语句对建模,利用词形、语义、词性和共现等信息计算单词间的相似度,利用加权二......
在基于语料库的统计翻译方法中,基于短语的统计翻译与基于单个词的统计翻译相比可以更好地处理句中词语之间的关系,从而有效地提高......
这篇论文的工作专注于提高基于层次短语的翻译模型的重排性能。主要包括三个方面:一是提出了一个新颖的方法来裁剪已有对齐模型中......
维吾尔语中,词的复杂形态是导致数据稀疏问题的主要原因,为降低数据稀疏对词对齐和机器翻译的不良影响,尽可能挖掘词尾携带的语义信息......
在利用大规模英汉双语平行语料库进行双向双语翻译词典建设时发现:由于错误累计问题.现有词对齐技术无法直接获取质量较高的双语词......
描述了一个基于统计机器翻译的汉维词对齐系统。系统处理过程分为两个模块:预处理和词对齐。预处理过程包括汉文文本预处理和维吾......
期刊
维吾尔语是典型的粘着性语言,其复杂的形态以及众多的词缀影响维吾尔语-汉语词语对齐的质量.本文提出对维吾尔语词进行形态分析并......
本文引入领域自适应这一方法,对现有的统计机器翻译词对齐方法进行改进,其中主要过程是首先运用最大熵分类器方法对大规模双语平行......
中文分词是计算机翻译和搜索引擎技术等的一个瓶颈,目前国内外对汉语分词的研究仍远不如人意,本文对汉语分词歧义做了探讨和分析,......
...
基于统计的词对齐方法需要大规模的双语语料作为输入,难以避免数据稀疏的问题并且算法时间开销大。针对句子或段落级的实时性对齐......
高效的自动词对齐技术是词对齐语料库建设的关键所在。当前很多词对齐方法存在以下不足:未登录词问题、灵活翻译问题和全局最优匹配......
词对齐是统计杌器翻译中的重要技术之一。该文提出了一种重对齐方法,它在IBMmodels获得的正反双向词对齐的基础上,确定出正反双向对......
对齐错误率(Alignment Error Rate,AER)是目前通用的词对齐评价标准。近年来的研究表明,AER虽然在一定程度上能够反映词对齐的质量,......
在传统的机器翻译(machine translation,MT)与计算机辅助翻译(computer aided translation,CAT)中,译员与翻译引擎之间的交互受到很大......
韩汉双语语料库短语对齐对于基于实例的韩汉机器翻译系统具有重要意义,该文从韩国语名词短语结构特点出发,在基于统计和基于词典的......
描述基于统计机器翻译的汉语到维吾尔语的一对一词对齐系统。系统进程分为两个模块:预处理和词字对齐。预处理过程,包括中文文本预处......
提出了一种基于句子级对齐的双语语料库的英汉词对齐方法.它建立在句对的集合表示形式的基础上,通过最小求交模型实现词对齐.使用......
描述了一个基于统计机器翻译的汉维词对齐系统。系统处理过程分为两个模块:预处理和词对齐。预处理过程包括汉文文本预处理和维吾尔......
针对词对齐算法在处理大规模平行语料时计算时间复杂度较高的问题,提出一种基于图形处理器(GPU)的词对齐并行计算方法。首先分析了......
词对齐被广泛的用于基于短语的统计机器翻译中,词对齐效果的好坏直接影响了机器翻译的质量。提出将隐马尔科夫模型用于汉维词对齐时......
维吾尔语丰富而复杂的形态结构往往对维汉词对齐产生不良影响.如果将词尾丢弃只保留词干,虽然可以解决数据稀疏问题,但同时丢掉词......
在利用大规模英汉双语平行语料库进行双向双语翻译词典建设时发现:由于错误累计问题.现有词对齐技术无法直接获取质量较高的双语词汇......
词对齐是统计机器翻译系统中最重要的一个环节,统计机器翻译中的翻译模型和调序模型都是在词对齐结果的基础上构造的,词对齐阶段出......
本文引用各种例子,对汉语分词歧义类型进行分析,论述了汉语行文语法改革的必要性和改革方法,然后对汉语语法改革后的中文信息处理......
维吾尔语中,词的复杂形态是导致数据稀疏问题的主要原因,为降低数据稀疏对词对齐和机器翻译的不良影响,尽可能挖掘词尾携带的语义信息......