基于字符串相似度的维吾尔语中汉语借词识别

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:a53479051
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
维汉机器翻译过程中会出现较多的未登录词,这些未登录词一部分属于借词(人名、地名等)。该文提出一种新颖的根据借词与原语言词发音相似这一特性进行维吾尔语中汉语借词识别的方法。该方法对已有语料进行训练,得到面向维吾尔语中汉语借词识别的维吾尔语拉丁化规则;根据以上规则对维吾尔语拉丁化,并对汉语词进行拼音化,将借词发音相似转换为字符串相似这一易量化标准;提出了位置相关的最小编辑距离模型、加权公共子序列模型以及二者的带参数融合模型。实验结果表明,综合考虑字符串全局相似性和局部相似性的带参数融合模型取得了最佳的识别效果。
其他文献
3年风风雨雨,3年奋斗不息。洪涝灾旱没能影响重点工程建设进度,市场风浪没能影响增产增效的势头,突入其来的"非典"也没能影响员工拼搏的干劲。全国"五一"劳动奖状、全国环境
"当!当!……"警钟长鸣,声声震撼。12月23日8时30分,在成都市府青路一段3号大院内,四川石油管理局、西南油气田分公司领导班子及部分员工头戴白色安全帽,身穿橙色和红色信号服
国内外对天然气储量的管理方式,市场竞争的基础,输、储气建设规模,以及天然气管理与法规体系都有很大的区别和差距。根据我国国情和市场特点,对天然气的调控管理必须遵循天然
中国西部地域辽阔,民族众多,这里有刘三姐、阿诗玛和兰花花的故乡;有黄土高原、塞外宁夏、黄河岸边高亢悠扬的“花儿”,有草原辽阔、苍凉、古朴的长调,天山南北热烈深情的新
一首歌曲的钢琴伴奏部分,是作曲家从作品的整体内容和结构出发,经过精心的艺术构思创作出来的。一部写得成功的歌曲钢琴伴奏,是歌曲不可分割的部分,它对于整个歌曲的艺术表现
声乐教学是一门专业性的学科教学。声乐教学中的声乐小组课是师生双方共同的活动,假使我们在小组课教学中,如果能把主体对象——学生快乐的学主动的学放在首位,尽量使其获得
<正>~~
近年来,随着国民生活水平的不断提高,社会上兴起了一股学琴热潮,这无疑对提高整个社会音乐发展水平及国民的文化素质都是有益的。然而,随着钢琴教育的普及,如何提高儿童钢琴
油气田运输业受油气勘探开发工作量的制约和影响比较大,有其特殊性。重复购车和运价偏低导致川渝油气田运输市场无序竞争,不利于企业整体效率的提高。应采取诸如禁止重复购置
交集型歧义的切分问题是分词阶段需要解决难点之一。该文将交集型歧义的消解问题转化为分类问题,并利用融合丰富字特征的最大熵模型解决该问题,为了克服最大熵建模时的数据稀