基于熵模型的英汉人名对齐

来源 :中文信息学报 | 被引量 : 0次 | 上传用户：neithernor86

【摘要】

：

该文使用熵模型来对中英文双语语料进行人名对齐。熵模型综合利用双语人名词典、双语姓氏词典、词汇对齐概率、中英文人名的共现特征、基于最小编辑距离的音译相似度和基于语

【作者】

：

刘颖曹项

【机构】

：

清华大学中文系

【出处】

：

中文信息学报

【发表日期】

：

2016年3期

【关键词】

：

人名对齐熵模型音译相似度最小编辑距离词典

【基金项目】

：

国家自然科学基金(61171114);教育部自主科研项目(20111081010);教育部回国人员启动项目(20101021603)

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

该文使用熵模型来对中英文双语语料进行人名对齐。熵模型综合利用双语人名词典、双语姓氏词典、词汇对齐概率、中英文人名的共现特征、基于最小编辑距离的音译相似度和基于语音匹配的音译相似度。实验结果表明,基于熵模型的中英文人名对齐在大规模语料库的实验中达到了较好的人名对齐正确率和召回率。我们分析了人名对齐存在的主要错误,并针对主要错误给出了可能的解决方案。

其他文献

文学悖论词语与语境浅探

文学悖论语言可分为“奇异”和“反讽”两种形式。文学语言中，为追求语言的“超凡脱俗”，表达式的字典义和语境义常常出现偏离，偏离的极致便是对立，于是产生悖论。悖论是对立的语

期刊

悖论语境奇异反讽字典义语境义paradox context of situation distinction irony definitio

集散控制系统（DCS）的发展及展望

本文主要以横河公司的产品为例,介绍DCS的功能、结构、特点,并说明了DCS发展的三个阶段及其特点、存在的问题以及DCS今后的发展趋势.

期刊

集散控制系统DCS分散控制集中管理控制网络DCSDistributed controlCentralizing supervisionControl

金融危机背景下的经济治理——2009年诺贝尔经济学奖得主的学术贡献及启示

2009年诺贝尔经济学奖授予了奥斯特罗姆和威廉姆森，以表彰他们在经济治理方面作出的贡献。奥斯特罗姆为公共资源管理和集体合作指出了一条可行路径；威廉姆森为企业的存在和企业

期刊

经济治理社会资本企业边界交易成本经济政策

邓小平资本主义观的理论创新

在建设中国特色社会主义的伟大实践中,邓小平既准确地分析了当今世界资本主义的基本矛盾,又深刻地揭示了社会主义终将代替资本主义的客观规律;既对发达资本主义国家有所论述,

期刊

邓小平理论创新中国特色社会主义资本主义国家发展中国家马克思主义基本矛盾客观规律中国化世界Deng Xiaoping capitalism t

关于电大《服务营销》课程教材选用与教学的探讨

文章就<服务营销>课程教材的选用与教学问题进行一些尝试性的探讨,提出适用的教材就是好教材的观点,建议进行考试制度的改革,建立健全适应以学生为主体的考试办法,并进行教学

期刊

电大教育服务营销教材教学

基于熵模型的英汉人名对齐

其他学术论文