维吾尔语-乌兹别克语机器翻译研究

来源 :新疆大学 | 被引量 : 0次 | 上传用户:hellangel112
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自从计算机发明以来,人们对机器翻译的兴趣越来越大。机器翻译是指计算机把一种自然语言(源语言)转换成另一种自然语言(目标语言)的过程。维吾尔语和乌兹别克语在单词结构、构形、词性、句法等方面有很多相同点或相似之处。因此,实现维吾尔语和乌兹别克语的机器翻译比较容易。本文中提出了基于词典和规则相结合的维吾尔语和乌兹别克语机器翻译方法。首先分别研究维吾尔语和乌兹别克语的字母及其对应关系、音节划分规则和音节关系、单词结构和词类关系、句子结构和成分关系等。在此基础上,构建两种语言对齐词典和字母对应规则库并实现基于词典的维吾尔语和乌兹别克语翻译方法和基于字母转换规则的维吾尔语和乌兹别克语翻译方法;随后结合两种翻译方法实现基于词典和规则相结合的维吾尔语和乌兹别克语机器翻译系统。乌兹别克语到维吾尔语方向的翻译中发现,乌兹别克语字母和维吾尔语字母之间存在歧义现象,一个乌兹别克语字母对应两个及以上维吾尔语字母。对这种歧义现象用最大熵特征选择方法来判断歧义字母对应的维吾尔语字母并生成目标语言。初步优化了基于词典和规则相结合的乌兹别克语-维吾尔语机器翻译系统。小规模的实验结果表明该系统在维吾尔语和乌兹别克语机器翻译准确率较高,其中乌兹别克语到维吾尔语方向的翻译质量比维吾尔语到乌兹别克语方向的翻译质量高。在以后的工作中,该系统还可通过双语词干库和词缀库规模的不断扩大、双语翻译规则的不断完善,以及可以用现有的词典和规则相结合的翻译基础上分析词性变化等方法有效提高翻译质量。
其他文献
随着计算机网络技术的发展,特别是Internet的广泛应用,现代社会对信息及信息系统的依赖程度日益加深。然而信息技术在带给生活工作便利的同时,也带来了巨大的安全隐患,为了保障信
随着现代计算机科学技术的发展,使用计算机进行图像处理操作变得越来越普遍。计算机图像处理在日常的工作生活当中的某些流程或领域中也扮演着越来越重要的角色。图像匹配问
随着网络上的信息量迅速的增加,如何有效的处理和组织这些文本数据,成为当前研究的重要课题,文本分类是其中的核心课题之一。文本分类的任务是在给定类别标签的前提下,根据文
对于传统工矿企业,如何有效地进行工程项目管理是当前面临的关键问题。网络信息技术与工程项目管理理念的结合是解决这个问题的重要措施之一。任务管理系统作为提升企业核心
L1距离问题是计算几何领域的重要研究课题之一。通过对L1距离问题特性的研究,能够得到求解计算几何经典问题的有效算法。因此,对于L1距离问题的研究,不仅具有重大的理论研究
立体匹配算法是双目立体视觉研究中的重要研究内容,大多数匹配算法获得匹配图像的稠密立体视差图。稠密立体视差图是进行视觉测量、三维重建等许多应用的基础。大多数立体匹配
随着计算技术、网络技术和控制技术的深入发展,一种最新的复杂系统Cyber-physical Systems应运而生。Cyber-physical Systems是运用3C技术和3i技术手段集计算、通信与控制于
RFID数据具有流式、海量、时态、语义丰富、不可靠的特点,随着RFID技术的广泛应用,如何实时高效地清洗RFID系统产生的不可靠海量数据是一个亟需解决的问题。   传统的数据
现如今,飞速发展的移动通信技术和手机普及率的快速增长,使得手机短信使用率迅速增加,因为短信以其容易使用、快速、价廉、可靠的特点,很快被广大手机用户接受,已经成为一个
淮河流域洪涝灾害频繁,因灾害而产生的直接及间接损失较重,急需一种新的技术手段以实现防洪减灾工作的数字化、高效化,从而降低灾害损失。虚拟现实技术、地理信息系统技术等