Internet中文智能搜索引擎汉语自动分词系统设计

来源 :广西师范大学 | 被引量 : 0次 | 上传用户:wwling_girl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文详细描述了中文智能搜索引擎中汉语自动分词模块的设计方案与实现方法。 本文从目前发展迅速的搜索引擎技术的综述出发,结合中文智能搜索引擎技术的发展现状以及具体应用情况出发,根据项目要达到的目标逐步引出课题中心——汉语自动分词模块的设计与实现。然后从理论上分析和比较了目前的各种汉语自动分词方法,对各种分词方法的技术特点进行了阐述,对自动分词发展现状和趋势作了概括性的总结。根据课题应用具体现状,阐述了适合于本课题的分词方法和分词模块预期达到的性能指标。最后详细描述了汉语自动分词模块的具体设计,包括总体设计以及各模块设计等,同时给出了一些关键性的例程说明和程序设计的关键点总结。 本文所包含的内容完全是面向应用的,具体的技术选择与整体的设计思想完全根据实际的应用需求而定,采用的都是比较成熟的技术,实现了理论联系实际。另外,本文所描述的汉语自动分词模块已可以在基于命令行的情况下,进行分词处理。
其他文献
To model the underwater electric potential (UEP) of ships, a multiple point-electrodes method is commonly used. However, it is difficult to determine the total
A formation model of manned/unmanned aerial vehicle (MAV/UAV) collaborative combat can qualita-tively and quantitatively analyze the synergistic effects. Howeve
TFT-LCD(薄膜晶体管液晶显示器)主要应用于计算机、视频终端、通讯及仪器仪表等行业。随着以LCD为代表的平板显示器的迅猛发展,TFT-LCD显示屏大量上市。尤其是在桌面系统逐渐
随着实时信号处理对速度的要求不断提高,需要在实时并行处理系统中不断使用高性能的处理器——新型DSP器件.该文研究的主要目的就是对新型的ADSP SHARC处理器进行应用开发,讨
Ballistic impact induces complex stress states on fiber-based armor systems. During impact fibers un-dergo multiaxial loading which includes axial tension, axia
本文提出了一种基于DSP实现的馈线式远程终端的设计方案。系统通过6路电流采集、6路电压采集、16路的状态采集以及2路的脉冲采集获取相应的数据信息;以高性能数字信号处理器TMS320VC5402为核心构成数据处理单元;以高性价比的可编程逻辑器件EPM7128为全局控制器;同时数据可以通过键盘和数码管进行现场控制。本文首先介绍系统设计的总体结构,并详细阐述了各主要功能模块的工作原理、软件设计思想,最后