基于歧义二叉树的汉语分词方法

来源 :计算机辅助工程 | 被引量 : 0次 | 上传用户:qijing1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
歧义问题是自动分词系统中要解决的主要问题之一。本文介绍一种新的汉语分词方法,它利用所建立的歧义二叉树,得到多种切分可能,通过分析歧义字段的特性,再结合规则处理和统计模型进行汉语分词。 Ambiguity is one of the main problems to be solved in the automatic word segmentation system. This paper introduces a new Chinese word segmentation method, which uses the ambiguous binary tree to establish multiple segmentation possibilities. By analyzing the characteristics of the ambiguous fields, the Chinese word segmentation is combined with the rule processing and statistical models.
其他文献
山西艺术职业学院在学院领导的正确领导下,带领我们走过了一个又一个艰辛的创业历程,实现了一个又一个骄人的业绩。从两校合并到改制建院,从一把酸枣到全国知名,学院一步一个
诸子文献对颜回形象的征引大致可以分为三类,一类是以《论语》为代表的直接描述颜回形象本身,一类是以《庄子》为代表的借颜回形象来代言自己的思想理论,再一类是以《荀子》
公开披露的央企年报显示,许多央企的独立董事都是由退休高官或是其他央企的退休领导担任,这些人的年薪高达数十万元。由此想到,有“铁娘子”之称的国务院前副总理吴仪在退休
从集体植树活动所想到的……沙苑春季参加植树活动已经成为习惯,这是应该称道的大好事。然而,个别单位在搞这项活动的时候,却使其变了味道。近几年笔者参加了几次植树活动,看到的
商务英语写作教学一直以书本的商务文本分析为主。文本语篇分析中,教师与学生的语言互动是动态的,作为教学辅助手段的板书是静态的,而文本分析也可以采用很多除板书外的教学
我们首次在湖南发现了钾镁煌斑岩。这套岩石由于遭受强烈风化和蚀变,与典型的西澳钾镁煌斑岩相比,其K_2O和MgO含量明显偏低,Al_2O_3含量偏高。REE含量、金云母成分及以金云母
20世纪50年代到60年代,只有做宗教工作的人和在民族地区工作的人关心宗教问题,一般的人不太关心,在学术界也没有宗教学这门学科。当时有一个总的看法,认为宗教是消极的东西,
本文通过历时和共时比较研究,认为11世纪的《突厥语词典》中的一种宾格附加成分应为-n,而不是像有些学者认为的那样为-in、-yn/n、-un及一sin/、-sn,事实上,其中的-i、-y、-u和-si、-s
林业加紧两大体系建设本刊讯林业部部长徐有芳在1996年12月11日至14日在京召开的全国林业厅局长会议上提出,按照国务院批准实施的《1989—2000年全国造林绿化规划纲要》,今后4年我国造林绿化将进入
“十一五”期间,青岛市委、市政府高度重视应急管理工作,应急管理专门机构从无到有到不断健全,体制机制从创建到运行到不断完善,相关工作从起步到展开到不断深入,应急队伍从