基于Trie结构的带通配符的相似字符串匹配算法

来源 :计算机应用 | 被引量 : 17次 | 上传用户:oliu1113
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出了一种新的相似字符串查询的方法。其目的在于提高基于相似字符串匹配的查询在大规模字符串数据库中的查询效率,并且提供带通配符的字符串查询方式。该方法使用Trie数据结构组织数据库中的数据,使用基于编辑距离的相似字符串匹配方法,在Trie数据结构中进行高效的匹配和查询,得到K相似度下的候选词集。实验证明,本方法在K 2时具有相当高的查询效率。
其他文献
“组卷系统”是以各种题型与难度的试题库信息为基础 ,利用计算机随机抽取具有少重复、难易度适当的试卷 ,并使对试卷的排版、打印和存档及日常的考核工作更加方便。现有的“组卷系统”已开发了不少 ,但能真正满足实际需求并不多 ,本文以已开发完成组卷系统为例就系统功能的设置、优化与实现作一些探讨
文档的版本管理是协同编著系统中必不可少的组成部分。文中在分析现有的一些版本管理模型的基础上 ,提出了有效的CSCA版本管理模型和相应的版本管理方法 ,并给出了在J2EE平台上的实现方案。
针对空管自动化系统和空管人员的实际需求,介绍了开发实现航空地图信息系统的主要技术。系统具备地物对象的编辑、航空地图数据的显示和存取等功能。文中分析了航空地图信息系统的模型,并给出了在UNIX操作系统中,基于Motif环境开发系统时的具体实现技术。
介绍了在配电线路安全监测温度数据传输中应用Zigbee通信技术,即使用一种以太阳能为能源、超级电容为储能装置、超低功耗的Zigbee芯片发送数据的传感器装置实现温度数据的无线
为探讨中药二术茯苓散及其组分对鸡离体盲肠运动张力的影响,试验采用离体器官试验法,将鸡的盲肠置于盛有生理溶液的麦氏浴槽内,维持(41±0.5)℃恒温,分别加入不同剂量的白
针对图形图像处理器中指令与数据加载以及数据收集的问题,设计和实现了一种时钟共享多线程处理器中的SIMD控制器,完成相关SIMD指令的发送、数据的加载和数据的收集。该控制器
针对有序信息表的排序问题,提出了总体排序的过程框架。将有序信息表转化为二进制信息表,运用粗糙集理论对信息表进行简化,在对属性值标准化的基础上构造有序信息表中实体的排序度量函数,根据度量函数值的大小进行排序。实例表明该过程框架在误差允许范围内是有效可行的。