基于编辑距离的字符串模式匹配算法研究

被引量 : 0次 | 上传用户:sinoerli
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
编辑距离是模式匹配的重要组成方面,是模式匹配中相似度的一种度量指标。它在模式匹配中具有重要的基础作用,有着不可替代的意义。由于现有的模式匹配的匹配速度并不是很好,编辑距离值的准确性也不是很高。因此,编辑距离逐渐成为模式匹配问题中的研究热点。本文针对已有的编辑距离定义和模式匹配速度不佳的问题,详细了解了编辑距离的定义和各种模式匹配算法以及不同模式匹配的相似度的计算方法,同时对编辑距离的定义和编辑距离算法进行了深入的研究和分析。首先,对模式匹配中已有的编辑距离定义和编辑距离算法的优缺点进行了详尽的分析,针对模式配中编辑距离的准确性,提出了一种新的编辑距离定义,使用新的编辑距离定义,可以使得计算出来的编辑距离的值具有更好的准确性。其次,本文综合、详细的分析了几种编辑距离的计算算法,针对已有的模式匹配速度效率不佳的问题,提出了基于编辑距离的模式匹配算法,即在新的编辑距离定义的基础上,增加了一个字符串快速扫描算法,在大规模数据集中使用该模式匹配算法,能够有效的减少反复执行操作的时间,从而获得了更高的时间效率。最后,分别通过数学方法和实验进行理论证明和实验验证,通过与已有的编辑距离算法进行对比,分别验证了基于编辑距离的模式匹配算法的匹配速度和有效性。
其他文献
山东安丘董家庄汉画像石墓,现位于安丘市博物馆院内,原址在城区西南9公里的凌河镇董家庄村北,是安丘市迄今发现的规模最大的汉画像石墓。董家庄汉墓是在1959年修建牟山水库时
2019年第91届奥斯卡颁奖典礼上,由流媒体平台Netflix出品的电影《罗马》获得包括最佳影片在内的10项提名,最终获最佳外语片、最佳导演、最佳摄影3项大奖。此前,该片已获第75
目的探讨乙肝病毒X蛋白(HBx)、人血管生成素样蛋白4(ANGPTL4)在乙肝相关性肝癌中的表达及意义。方法采用免疫组织化学检测69例乙肝相关性肝癌组织中HBx和ANGPTL4的表达情况,
在建设项目安全管理中,理解安全风险以及导致其发生的风险因素至关重要。传统的风险评估方法基于专家主观经验评价风险发生的概率,并未考虑施工现场安全管理的实施效果,经常
<正>0前言 工业有害废弃物是根据国家统一规定的鉴别方法和鉴别标准认定的,是具有各种毒性、易燃性、腐蚀性、反应性等有害特性之一,并对人体健康和环境可能造成即时或潜在
童年的友谊是真挚的,是纯真的。《窗前的气球》正是通过一个红气球向孩子们传递着互相关心的温暖之情。文童虽然短小,但字里行间无不流露着这浓浓的友情。在教学中,我带着孩子们
二氧化碳(CO2)减排作为影响未来世界经济和环境的重大国际问题,是我国实施可持续发展战略的重要组成部分。作为一种有效的CO2还原方法,催化氢化CO2已被国内外学者广泛研究,但
舒适性资源的概念提出已经有近40年的时间了,但在理论方面还有很多基本的问题有待研究探讨。本文针对舒适性资源的概念,舒适性资源与自然资源、物质性资源、环境容量资源和自
实践教学作为全日制硕士专业学位研究生培养过程中的特色环节之一,是提高学生实践能力、理论用于实际能力的重要方法,也是实现全日制硕士专业学位研究生人才培养目标的重要途
李家马架子遗址位于哈尔滨市阿城区东北、松花江支流蜚克图河下游左岸的岗地上。2016年6—8月,为配合哈尔滨至佳木斯铁路客运专线工程建设,对该遗址进行了抢救性考古发掘工作