论文部分内容阅读
经济全球化的发展带来了急速发展的软件外包业务。对日软件外包要求我国软件企业具有较强的日文文档写作能力,这个写作能力的限制成为对日软件外包发展的一个绊脚石。
本文从对日软件外包的文档写作过程的分析入手,提出了以交互式翻译代替写作的方式来解决对日软件外包文档写作难的问题。针对对日软件外包文档中句式重复数量大、专业词汇应用多、句式简单等特点,提出以基于实例翻译方法为核心的,以基于规则方法作为的短语翻译技术的,以基于模板的句子生成技术为补充的,以友好的人机界面作为交互手段的计算机辅助翻译理论。
在技术上,主要涉及中文分词、语料库收集技术、句子相似度计算、句子对齐技术、短语的翻译、利用短语替换的译文合成技术、翻译记忆技术、交互式提示技术。
语料库收集技术中主要面对的语料来源有两个:原有的项目文档和Internet上的语料。通过机器自动获取和人工校对的方式,得到了一个平行的日汉双语语料库。
句子相似度计算中,采用改造的《同义词词林》作为比较词距离的知识库,采用编辑距离的方式得到了句子之间的距离,再用其来描述相似度。
句子的平行技术中设计了中文句子间词汇级的对齐和中日句子间词汇级的对齐方法。并在此基础上设计了以短语替换为手段的译文生成方法,实现了句子的翻译。
为了能让用户更容易更方便地参与翻译,也为了最大限度地使用例句,本文还提出一些具有个性的用户接口设计方案。
最后应用这些翻译理论,结合东软国际软件服务事业部的需求,开发了一个面向对日软件外包的汉日计算机辅助翻译系统,并进行了一定规模的应用。