基于熵模型的英汉人名对齐

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:neithernor86
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文使用熵模型来对中英文双语语料进行人名对齐。熵模型综合利用双语人名词典、双语姓氏词典、词汇对齐概率、中英文人名的共现特征、基于最小编辑距离的音译相似度和基于语音匹配的音译相似度。实验结果表明,基于熵模型的中英文人名对齐在大规模语料库的实验中达到了较好的人名对齐正确率和召回率。我们分析了人名对齐存在的主要错误,并针对主要错误给出了可能的解决方案。
其他文献
文学悖论语言可分为“奇异”和“反讽”两种形式。文学语言中,为追求语言的“超凡脱俗”,表达式的字典义和语境义常常出现偏离,偏离的极致便是对立,于是产生悖论。悖论是对立的语
本文主要以横河公司的产品为例,介绍DCS的功能、结构、特点,并说明了DCS发展的三个阶段及其特点、存在的问题以及DCS今后的发展趋势.
2009年诺贝尔经济学奖授予了奥斯特罗姆和威廉姆森,以表彰他们在经济治理方面作出的贡献。奥斯特罗姆为公共资源管理和集体合作指出了一条可行路径;威廉姆森为企业的存在和企业
在建设中国特色社会主义的伟大实践中,邓小平既准确地分析了当今世界资本主义的基本矛盾,又深刻地揭示了社会主义终将代替资本主义的客观规律;既对发达资本主义国家有所论述,
文章就<服务营销>课程教材的选用与教学问题进行一些尝试性的探讨,提出适用的教材就是好教材的观点,建议进行考试制度的改革,建立健全适应以学生为主体的考试办法,并进行教学