一种高效的汉语自动分词词典机制

被引量 : 0次 | 上传用户:tuojing
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
词典是汉语自动分词的基础,分词词典机制的优劣直接影响到汉语自动分词的速度和效率。本文简要分析了汉语自动分词的三种主要算法,指明了分词词典机制在自动分词中的重要性,然后深入研究和比较了已有的几种典型分词词典机制,总结了各词典机制的优缺点。在此基础上,根据汉语中二字词较多的特点,提出了一种新的分词词典机制,该机制在词典数据结构中添加二字词检测位图表,在分词时,该位图表可快速判断二字词来优化分词速度。文章还给出了在正向最大匹配分词算法中应用该方法实现自动分词的算法分析,并选取人民日报语料片断进行了实验测试。实验结果表明,该分词词典机制有效地提高了汉语自动分词的速度和效率。
其他文献
哈国有关油气资源领域哈萨克斯坦含量规则的法律规定,在商品、服务采购以及雇佣员工过程中,不仅将完成哈萨克斯坦含量作为法定义务,且规定其为必备合同条款。在双重规制下,使
随着农村市场经济的不断转型,农业逐渐走上了市场化、产业化和专业化的发展道路,农民专业合作社便应运而生。农民专业合作社作为联接小农户与大市场的纽带,很大程度的改进了
<正>2018年11月28日在京举行的"中国单套最大高效合成气制乙二醇装置成功投产"新闻发布会上,石油和化学工业规划院院长顾宗勤建议企业关注煤制PX(对二甲苯)技术,一旦取得突破
为研究福建省九龙江口海门岛大型底栖动物的群落结构变化,于2014年11月至2015年8月对海门岛红树林区的大型底栖动物进行4个季度的调查研究,并利用PRIMER软件进行群落物种多样
文章分析了目前文华学院三维创新课程中的现状以及存在的问题,提出将项目式教学方法引入到教学中,将计算机技术与工程实际相结合,提高学生的机械创新能力。同时在教学过程中
目的研究喉癌患者喉部分切除术后嗓音功能情况及变化趋势,以探讨不同术式与患者术后嗓音质量的关系。方法应用计算机嗓音声学测试系统(Dr.Speech Science for Windows软件,美
近年来,随着自然科学和社会科学之间的相互交叉渗透,复杂网络成为新的研究热点,应用复杂网络的理论、方法和思路来研究网络时代的复杂性科学问题反映了科学研究向综合性发展
众筹是当下互联网金融中的热门话题,是实现资金合理、高效匹配的一种新兴投融资交易方式。随着市场经济活跃程度的不断上升,我国的中小微企业和个人创业者的融资缺口逐渐扩大
当前物理实验教学或多或少存在着一些不尽如人意的地方,为提升学生物理学科的核心素养,实验教学的改革与创新必不可少。从加强实验设施的基础建设,鼓励自制实验道具,到引导学
《魔桶》是犹太作家马拉默德最著名的短篇力作,曾荣获美国国家图书小说奖。主人公列奥·芬克尔在"寻配偶"中经历了3次精神折磨,对犹太人的受难与救赎命运有了某种大彻大悟,从