短语切分概率在统计机器翻译系统中的应用

被引量 : 0次 | 上传用户：jishunhui

【摘要】

：

在统计机器翻译领域,基于短语的翻译模型的性能优于基于词的翻译模型。目前在基于短语的所有机器翻译模型系统中,源语言都是以均匀分布的方式进行短语切分,然后将所有可能的

【作者】

：

张步峰何丕廉张冬冬李沐周明

【机构】

：

天津大学计算机系; 微软亚洲研究院自然语言计算组;

【发表日期】

：

2004年期

【关键词】

：

统计机器翻译短语切分翻译模型最大熵模型短语切分概率模型

【基金项目】

：

微软亚洲研究院自然语言计算组实习的研究成果

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

在统计机器翻译领域,基于短语的翻译模型的性能优于基于词的翻译模型。目前在基于短语的所有机器翻译模型系统中,源语言都是以均匀分布的方式进行短语切分,然后将所有可能的短语切分结果送入解码器,最终得到翻译结果。遗憾的是,这种基于均匀分布模型对源语言进行短语切分的方式没有充分结合源语言的语言学知识,可能会误导翻译模型以致选择错误的候选目标短语。本文提出通过对源语言知识进行统计学习,获得短语切分概率模型,以指导对源语言进行合理的短语切分。短语切分概率模型可以独立成为一个新的特征,因此能够非常容易的嵌入以最大熵模型为框架的主流统计机器翻译系统中。通过对中英翻译和法英翻译的实验评测,证明了该方法可以明显改善统计机器翻译系统的性能。

其他文献

创新炼化企业大中专毕业生培养机制

大中专毕业生作为企业员工队伍中年轻的群体，是企业未来发展的中坚力量。当前安庆石化正处于新一轮有效发展的关键时期，以炼化一体化项目为核心的一大批重点工程即将开工建设．企

期刊

炼化企业毕业生中专培养机制创新人力资源管理人才资源

储能电池参与电网二次调频的容量配置与控制策略研究

随着化石能源危机及环境保护问题的日益突出,具有随机性、间歇性和难以预测性的风电等新能源在电力工业中得到快速发展,同时也给电网调频带来日益严峻的挑战。常规机组调频容

学位

电力系统二次调频电池储能电源成本-效益容量配置优先顺序法控制策略

短语切分概率在统计机器翻译系统中的应用

其他学术论文