基于句法规则的彝汉双语调序模型研究

来源 :贵州大学 | 被引量 : 2次 | 上传用户:blueuser
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,少数民族信息化处理技术的研究越来越受到人们的重视;利用自然语言处理技术实现少数民族语言信息化处理过程不仅有助于提高少数民族信息化水平,还能加强多民族间信息交流与融合。机器翻译研究过程中,源语言与目标语言之间语言顺序的差异很大程度的影响了译文质量。彝语和汉语在语言顺序上呈现非单调对称性,这样的差异不仅影响彝汉翻译译文质量,同时也极大地增加了实现彝汉机器翻译过程的难度与复杂度。针对彝语和汉语在语言研究上的差异,本文对两者的语言结构差异进行了对比性研究,并提出彝汉调序模型实现对彝语语序的调整。为实现该模型,本文对彝语句法进行了系统性研究,总结了彝汉句法结构差异,并实现了彝语句法解析过程,得到了彝语短语结构树表示形式;该调序模型通过调整彝语短语结构树,从而调整彝语语序,使其更符合汉语语序。为实现该模型,本论文的主要研究工作如下:实现彝语句法解析;在研究彝汉句法结构差异之前,本文对彝语句法规则进行了系统性研究。在彝语语言学家彝语句法研究成果的基础上,本文结合上下文无关文法,总结出了一系列彝语句法规则,并结合CKY算法,实现了彝语句法解析过程,得到句法解析结果—短语结构树作为调序模型输入;提出彝语调序规则;本文在总结彝汉句法结构差异的基础上,提出了一系列彝语调序规则,用于指导调序操作;此外,本文通过实验方式对调序规则正确性进行验证,实验结果表明在调序规则指导下的调序结果在正确率上有良好表现;提出彝语预调序模型;在彝语调序规则指导下,本文定义并实现了彝语预调序模型,该模型通过调整彝语短语结构树,从而得到调序后的符合汉语句法结构的彝语语言序列;同时,本文还实现了基于词对齐表的彝汉直译过程,用于对比调序前和调序后译文质量的好坏。实验结果显示,本文提出的调序模型可以较为明显地改善译文质量。
其他文献
2008年以来,地方政府投融资平台的非理性盲目扩张极大地增加了我国地方政府的债务风险.文章阐述了我国地方政府投融资平台的债务风险现状,分析了地方投融资平台运营模式与地
2003年10月16日6时,"神舟"五号宇宙飞船在完成预定考察任务以后,安全返回了地面.
<正>在经济走势和货币政策全球趋同的背景下,全球主要大都市房地产市场走势出现了一定的相似性和趋同性。为了更好地跟踪和研究国际及国内大都市的房价变化,易居房地产研究院
世界一直在变,成长的滋味却依旧那么相似!光阴荏苒,岁月匆匆,悠悠岁月在微颤的笔尖下无情地流逝,流走了我们的童年,流走着我们的青春。然而,那份幽幽的情思,脉脉的童趣,却在岁月的酿造中愈来愈浓——这就是“成长滋味”。同学们,请拿起你的生花妙笔,写出成长过程中的酸甜苦辣,让我们和你一起分享“成长滋味”——你瞬间的顿悟,我长久的感动!  主持人:火龙果  依然是粼粼的波光,而波光里的倩影,却只能在梦里相见
<正>蔚蓝的海,蔚蓝的天,蔚蓝的海和天的尽头,耸立着白得发亮的云山;白得发亮的云山下面,泊着一叶蓝灰色的帆。是该撒网的水域了。海沉默着,船上的五个人也都沉默着。三个年迈
谭嗣同随父宦游甘肃的经历砥砺了他任侠豪迈的性格和坚韧不屈的意志,而对陇原大地充满深情的描摹,则成了他的文学创作中成就最高的代表作品,更是甘肃近代文学的重要创获。
在国家加速推进事业单位分类改革、地勘项目断崖式锐减等多重压力下,煤田地勘单位产业构架等方面的问题日益凸显,优化升级现有产业,积极开拓产业新业态,降低对煤勘主业的依存
新中国成立以来,我国人的发展经历了从单向的“道德人”到异化的“政治人”,再到理性的“经济人”,并逐步走向理想的“全面人”的演进轨迹。从中给我们以深刻启示:生产力的发展是