服务于汉维机器翻译系统的双语句子对齐的研究

来源 :新疆大学 | 被引量 : 0次 | 上传用户:chair_mao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自上世纪80年代起,由于计算机科学的飞速发展以及计算机技术在语言研究领域中的迅速普及和应用,使得语料库语言学成为研究主流,其中平行语料库和比较语料库已成为语料库语言学研究的一个主要焦点。对于双语平行语料库,其研究工作主要有构建,对齐和标注等方面,其中研究不同级别的对齐技术是一个重要的中心课题,对齐不仅是进一步利用平行语料库获取一些语言知识的必要前提,也是机器翻译系统利用双语知识的重要前期处理。本文从句子对齐这一问题入手,介绍了目前句子对齐的几种基本的方法,之后具体的分析了汉维双语句子对齐问题,在此基础上,提出了采用基于锚点的方法完成汉维双语句子对齐,对汉维双语语料统计实验得到的结果进行分析,对此方法的权重系数做了改进,使其更适合于汉维双语句子对齐,之后介绍了锚点句对的自动校对的方法,从而提高对齐的正确率。
其他文献
双语语料库在基于实例的机器翻译,翻译知识的获取,双语词典的建立,词义消歧等领域有着重要的应用价值。大规模双语语料库的建设是进行基于语料库研究的基础。如何通过现有的
我国地大物博,海洋资源极其丰富。我国目前的海洋开发活动,主要集中在狭窄的海岸带和沿岸海域。随着海洋开发的深入,各行业开发活动与海洋资源以及生态环境之间存在很多矛盾。各
等圆Packing问题是一类典型的NP-Hard问题。拟物拟人算法源自客观世界和人类社会所蕴含的高度智慧,是求解等圆Packing问题的高效率启发式算法。拟物算法的思路与传统的数学模
仓储管理,在物流管理的流通路径中至关重要。在实际的物流环节之内,各种误差的出现产生在所难免,由于误差逐渐堆积到难以忍受的程度,库存的实际状况也就和模拟情况相去甚远,
图像超分辨率复原是图像处理中一个重要的研究课题,近年来一直是图像处理领域中一个研究热点,图像超分辨率复原不仅在理论上具有重要意义,在实际中也有广泛应用。该方法通过对图
联网审计是网络经济发展对审计的必然要求,是电子政务的重要组成部分。联网审计系统所基于的电子政务网和互联网环境是一个多层次、大规模、复杂交互的分布式环境,存在各种安全
ISO 9646中定义的针对路由器的测试方法已经不能满足多端口并发测试需要,为此,四川省网络通信重点实验室开展了对路由器多端口测试技术的研究工作,包括定义“多端口路由器并发穿
随着计算机应用技术和图形图像技术的深化和发展,人们日常信息成几何式的增长,可视化技术逐渐成为这个信息时代研究的热点,层次结构数据的可视化是可视化研究领域中的一个重要分
蛋鸡产业是中国禽业的主要支柱之一,从1985年开始,连续29年我国蛋鸡饲养量位居世界第一,是我国农村的一大产业,甚至是一些地区的支柱产业。与我国庞大的蛋鸡养殖和蛋品销售规模相
本文的目的是研究一种新的并行进化算法及其应用。群体智能算法是一种进化类算法,是解决优化问题特别是复杂系统优化问题的有效手段。而QPSO是一种新的、具有全局收敛性群体