短语切分概率在统计机器翻译系统中的应用

被引量 : 0次 | 上传用户:jishunhui
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在统计机器翻译领域,基于短语的翻译模型的性能优于基于词的翻译模型。目前在基于短语的所有机器翻译模型系统中,源语言都是以均匀分布的方式进行短语切分,然后将所有可能的短语切分结果送入解码器,最终得到翻译结果。遗憾的是,这种基于均匀分布模型对源语言进行短语切分的方式没有充分结合源语言的语言学知识,可能会误导翻译模型以致选择错误的候选目标短语。本文提出通过对源语言知识进行统计学习,获得短语切分概率模型,以指导对源语言进行合理的短语切分。短语切分概率模型可以独立成为一个新的特征,因此能够非常容易的嵌入以最大熵模型为框架的主流统计机器翻译系统中。通过对中英翻译和法英翻译的实验评测,证明了该方法可以明显改善统计机器翻译系统的性能。
其他文献
大中专毕业生作为企业员工队伍中年轻的群体,是企业未来发展的中坚力量。当前安庆石化正处于新一轮有效发展的关键时期,以炼化一体化项目为核心的一大批重点工程即将开工建设.企
随着化石能源危机及环境保护问题的日益突出,具有随机性、间歇性和难以预测性的风电等新能源在电力工业中得到快速发展,同时也给电网调频带来日益严峻的挑战。常规机组调频容