句子对齐相关论文
随着计算机和互联网的发展,在自然语言处理领域,以双语(或多语)平行语料库为基础的应用日益增多。除机器翻译方面的应用之外,平行......
双语语料库是存放两种语意对齐的语料资源和信息的仓库,是机器翻译和多语言处理的重要资源,被广泛的应用于机器翻译、机助人译、翻......
双语语料库在基于实例的机器翻译,翻译知识的获取,双语词典的建立,词义消歧等领域有着重要的应用价值。大规模双语语料库的建设是......
双语资源在计算语言学研究领域具有十分特殊的地位,对机器翻译、双语词典编纂、术语抽取、跨语言信息检索等研究和应用提供了有力......
近年来,互联网信息的爆炸式增长给了统计机器翻译新的契机,众多研究团体和商业机构开始从互联网上获取大规模的双语语料。机器翻译模......
平行语料库是机器翻译、跨语言检索和跨语言自动问答等自然语言处理(Natural Language Processing,NLP)任务的核心基础资源。平行......
随着中老两国关系的扩大和深入,加强汉语-老挝语之间的学术研究具有十分重要的现实意义。在自然语言处理任务中,平行语料库为统计......
构建双语平行语料库是实现基于实例的机器翻译的主要工作,而实现双语语料的对齐则是构建双语平行语料库的基础.主要目标是针对英语......
双语对齐是当前机器翻译中的一个重要研究课题,对于自然语言处理的一些其它任务,例如双语词典构建、词义消歧等也有很多的应用。双语......
摘要:在自然语言处理的研究和开发中,双语平行语料库的作用日益突显出来,平行语料库的建设对于机器翻译、双语词典编纂、词义消歧和跨......
该文从挂篮荷载计算、施工流程、支座及临时固结施工、挂篮安装及试验、合拢段施工、模板制作安装、钢筋安装、混凝土的浇筑及养生......
阐述了汉文-维吾尔文双语对齐语料库构建的一些技巧,通过实践提出了建设汉文-维吾尔文双语对齐语料库的方法.语料库收集汉文-维吾......
双语语料库的自动对齐已成为机器翻泽研究中一个十分重要的研究课题.目前的句子对齐方法有基于长度的方法和基于词汇的方法,本文根......
为提高汉维句子对齐方法的准确率,提出一种分段句子对齐方法。采用词汇信息和长度信息相结合的策略,识别出能作为锚点的一对句子(锚......
自动对齐的目的是将半结构化的注疏文献转化为结构化形式,从而为先秦文献的信息处理提供可靠的帮助。探讨《左传》及其注疏文献的......
本文提出了一种基于词性的判别函数,用来自动识别e句子对齐结果的正确性.通过反向采用基于长度的对齐算法,纠正了初步对齐产生的连......
传统的基于长度的汉英双语句子对齐算法大都以字节作为句子长度的计算单位.提出了以句子所含动词、名词、形容词、实词、字节及全......
双语平行语料库在自然语言处理领域有很多重要应用,但是大规模双语平行语料库的自动获取并不容易。该文提出了一种有效的从Web上获......
注疏文献中蕴含着丰富的知识,并且它们的行文方式具有半结构化特征。研究了经典古籍与其注疏文献句子对齐的方法,以及注疏文献中注......
随着东盟与中国的经贸日益增加,语言作为两个国家交流的重要渠道,通过人工智能来解决双语问题,也正成为一门重要的研究。双语平行......
双语语料库建设及其自动对齐研究对计算语言学的发展具有重要意义。双语对齐技术是加工双语文本的核心,对齐效果的好坏直接影响了......
本文提出了一种用于汉英平行语料库对齐的扩展方法.该扩展方法以基于长度的统计对齐方法为主,然后根据双语词典引入了词汇信息,而......
随着语料库语言学的兴起,基于实例的机器翻译(EBMT)得到越来越多的研究。如何快速准确地构建大规模古今汉语平行语料库,以及从大量的对......
双语句子对齐在双语语料库的处理中有着非常重要的地位,是构建双语词典的第一步工作。该文利用基于带权二部图的最大权重匹配模型为......
双语术语词典在生物医学跨语言检索系统中有着非常重要的地位,而双语句子对齐是构建双语词典的第一步工作。为了构想面向生物医学......
双语语料库句子对齐已成为新一代机器翻译研究中的一个至关重要的问题.对齐方法主要有基于长度的方法和基于词汇的方法,两者各具特点......
该文提出了一种从英汉平行语料库中自动抽取术语词典的算法。采用的是已对齐好的双语语料,中文经过了分词处理。利用英文和中文词性......
以《尼山萨满》为例,利用语料库的技术手段保护和传承少数民族文化典籍。构建了一个满族典籍的平行语料库系统原型,重点研究了该平......
提出了一种汉-维句子对齐混合算法,它是以基于词典的方法为主、基于长度的方法为辅的一种混合对齐算法.目的在于建立一个以汉文-维......
基于词典和句子的长度和位置信息的双语句子对齐方法在解决真实双语文本对齐问题时具有一定的普适性。在分析该方法的基础上,提出了......
介绍了藏汉句子自动对齐系统及其对齐方法,详细地分析了基于平行语料的藏汉句子自动对齐问题,提出了利用大规模高效藏汉双语词典进......
为提高汉维句子对齐方法的准确率,提出一种分段句子对齐方法。采用词汇信息和长度信息相结合的策略,识别出能作为锚点的一对句子(锚......
双语对齐是自然语言处理研究的重要课题之一,结合基于句子长度和基于词典的两种经典的对齐算法,通过段内寻找锚点的算法对双语互译......
目前分词工具在金融领域智能客服中无法对金融相关词汇进行有效切分,且基于单词的模型更容易受到数据稀疏性和词汇表外单词的影响......
双语语料库建设及其自动对齐研究对计算语言学的发展具有重要的意义。双语对齐技术是加工双语文本的核心,对齐效果的好坏直接影响......
对西汉时期司马迁所著《史记》原文(古文)与现代文译文(现代文)的平行语料进行句子对齐研究。对数线性模型将句子的长度特征、句子......
翻译比较规范的汉英语料适合用统计方法实现句子对齐.但评价函数中的参数计算不能采用处理印欧语种的方法,而要针对汉英语种的特点......
双语平行语料库在自然语言处理领域有很多重要应用,它为统计机器翻译模型提供不可或缺的训练数据,同时也是词典编纂和跨语言信息检......
词对齐研究是多文种信息处理工作的一项不容忽略的基础性研究内容。通过针对中文和蒙古文词对齐研究中存在的形态和词序不对称以及......
军事英汉汉英平行语料库建设对军事翻译工作和自然语言处理技术发展等有重要意义,但我国这方面建设却严重不足。各相关军事单位可......
专利分析广泛应用于管理领域,已成为研究热点。单语言专利分析只分析一种语言的专利,处理多语言专利的质量不高。多语言专利处理的......
传统的基于长度的汉英双语句子对齐算法大都以字节作为汉英句子长度的计算单位。提出了几种不同的汉英句子长度计算方法,分别以句......
句子对齐是将源语言文本中的句子映射到目标语言文本中对应翻译的过程,作为构建和扩充平行语料库的核心技术,其性能的优劣影响着平......
现如今,伴随着生活水平飞速发展,越来越多的人已经开始转向追求精神生活。文言文是我国文化的瑰宝,推广文言文不管是在学习还是生......
分析国内外计算机辅助翻译的现状与发展趋势,认为平行文本中句子对齐是英汉/汉英双语平行语料库领域的关键问题,对语料库能否有效......