面向对日软件外包领域的计算机辅助文档翻译系统

来源 :东北大学 | 被引量 : 0次 | 上传用户:zhangfei0960
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
经济全球化的发展带来了急速发展的软件外包业务。对日软件外包要求我国软件企业具有较强的日文文档写作能力,这个写作能力的限制成为对日软件外包发展的一个绊脚石。 本文从对日软件外包的文档写作过程的分析入手,提出了以交互式翻译代替写作的方式来解决对日软件外包文档写作难的问题。针对对日软件外包文档中句式重复数量大、专业词汇应用多、句式简单等特点,提出以基于实例翻译方法为核心的,以基于规则方法作为的短语翻译技术的,以基于模板的句子生成技术为补充的,以友好的人机界面作为交互手段的计算机辅助翻译理论。 在技术上,主要涉及中文分词、语料库收集技术、句子相似度计算、句子对齐技术、短语的翻译、利用短语替换的译文合成技术、翻译记忆技术、交互式提示技术。 语料库收集技术中主要面对的语料来源有两个:原有的项目文档和Internet上的语料。通过机器自动获取和人工校对的方式,得到了一个平行的日汉双语语料库。 句子相似度计算中,采用改造的《同义词词林》作为比较词距离的知识库,采用编辑距离的方式得到了句子之间的距离,再用其来描述相似度。 句子的平行技术中设计了中文句子间词汇级的对齐和中日句子间词汇级的对齐方法。并在此基础上设计了以短语替换为手段的译文生成方法,实现了句子的翻译。 为了能让用户更容易更方便地参与翻译,也为了最大限度地使用例句,本文还提出一些具有个性的用户接口设计方案。 最后应用这些翻译理论,结合东软国际软件服务事业部的需求,开发了一个面向对日软件外包的汉日计算机辅助翻译系统,并进行了一定规模的应用。
其他文献
近年来,随着Internet和视频编码技术以及硬件的快速发展,网络视频监控技术迅速发展起来。MPEG-4视频的实时传输在网络视频监控系统中具有非常重要的地位,它对整个系统的健壮
随着高性能处理器的不断发展,异构多核处理器逐渐成为了现代处理器发展的方向。异构多核处理器具有效率高、成本低等特点,深受人们喜爱,也成为了当前的热门的处理器系统。多
本论文从当前XML数据库的应用和研究出发,分析了传统XML数据库应用模型中存在的缺陷,对数据库主动规则进行了探讨,对如何扩展到XML数据库进行了研究和分析,最后通过具体应用
数据的爆炸式增长使得当前的存储系统规模越来越庞大。而云计算、云存储和大数据等新技术不断的出现,也对存储系统的容量、性能等方面提出了更高的要求。当前数据中心广泛使用
随着信息技术的迅速发展和林业信息化建设的不断深入,通过网络实现林权信息的统一管理,将成为今后林权管理信息系统的发展方向。林权管理信息系统依据林权管理信息化建设的发展
随着市场的开放,世界经济愈来愈全球化,市场变得愈来愈国际化。随着我国加入WTO以及电信行业的重组,国内电信业的市场环境已渐趋合理且竞争将日益加剧。如何改变经营模式和服务
本文对RPR网络的媒体访问控制层的参考和服务模型、媒体访问控制层的数据路径、数据链路层帧格式、RPR网络的公平算法进行了研究。在此基础之上,提出了一种基于RPR技术的小数
当今,信息技术的迅速发展,将企业带入了联机分析处理、数据仓库和数掘挖掘的信息分析时代。数据仓库在短短的几年内已经从一种单纯的理论研究发展成信息管理与信息系统开发领
图像数据规模的膨胀使其存储、传输、分析和处理面临巨大挑战,因此如何减小图像的存储和传输成本、快速分析和处理图像、从海量图像数据中选取有用信息变得尤其重要。为此,从改
网格就是将广域范围的各类计算资源(包括CPU、存储器、数据库等)通过高速的互联网组成共享的资源集成,提供一种高性能的计算、管理和服务的资源能力。使用这些资源就像用电力