基于正则表达式的复合规则集匹配技术研究

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:yuandt
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网内容的复杂化,传统的一些匹配方法已逐渐无法满足识别出网络数据流中关键字间的逻辑含义的需求。同时,随着互联网内容的膨胀,对于大量数据的快速匹配需求越来越强烈。因此,本课题的研究从网络数据的实际匹配出发,提出以“偏序”逻辑为基础的复合规则集的匹配方法,借鉴正则表达式的研究手段,对网络数据内容进行逻辑描述和内容匹配,最终达到平衡逻辑表达和快速匹配的折中效果。本课题的主要研究内容包括:1、分析当前网络应用环境中待匹配数据内关键字之间的逻辑特征,提出以偏序逻辑为描述的复合规则的匹配方法对网络数据进行逻辑匹配;2、通过“链式”正则表达式构造相应状态机的方法来完成整体的复合规则集匹配功能实体的架构。将复合规则集的匹配问题转化为状态机内状态转移的问题。同时,通过“半-DFA”和混合状态自动机的设计,来平衡整个状态机构造过程中的空间开销和匹配过程中的匹配速度的不平衡性;3、根据状态机的构造特点和复合规则集的逻辑特性,通过缩减字符集的方法对整个匹配功能实体的构造过程进行优化,缩减状态机的构造开销,减少后续状态跳转数目,提高整体的匹配速度;
其他文献
随着互联网技术的日益发展,人们逐渐从信息匮乏的时代进入了信息过载的时代。这种情况下,无论是信息的消费者还是信息的生产者都面临着严峻的挑战。对于消费者,无法快速的从
近年来,城市化进程的推进导致了城市人口迅速膨胀,大城市快节奏的生活使人们对时间观念和办事效率的要求更高。同时,移动通信技术的进步也带动了城市智能公交系统的飞速发展,
网络流量模型是流量预测和网络性能评价的基础,它不仅可以很好地反映真实网络流量的特征而且可以更好地指导与流量有关的实际应用。随着网络技术的飞速发展,网络节点呈现指数
燃料电池作为新能源领域中举足轻重的一个方向,受到人们的广泛关注。氢燃料电池汽车已经有商业化案例,但目前主流的燃料电池催化剂主要原料为铂金,高昂的成本阻碍了其大规模商业化。故设计廉价的燃料电池催化材料是其进一步发展的关键。此外,催化反应的中间产物的吸附能之间普遍存在线性关系(scaling relations)。它简化了催化剂的设计但同时也阻碍了催化剂性能的进一步提高。比如燃料电池阴极的氧还原反应(
近年来,移动互联网产业飞速发展,移动终端产品已逐渐成为人们生活中不可或缺的一部分,人们对移动互联网产品的需求也与日剧增。在如今移动互联网大发展的背景下,广大用户也对
中国女性导演徐静蕾凭借自己执导的电影频频获奖,《杜拉拉升职记》(下文简称《升职》)使其成为首部国产片票房破亿的女导演,这引起了研究者的普遍关注。从2003年第一部自编自导自演的文艺片《我和爸爸》(下文简称《爸爸》)开始,徐静蕾正式投入于电影的制作与拍摄。迄今为止,一共有七部电影作品:《爸爸》、《一个陌生女人的来信女人》(下文简称《女人》)、《梦想照进现实》(下文简称《梦想》)、《升职》、《亲密敌人
随着移动终端的快速发展,智能终端上丰富的传感器设备得到了广泛使用,参与式感知(Participatory Sensing)的概念也随之兴起,在参与式感知环境下,用户即是数据的受益者也是数
高效视频编码H.265/HEVC(High Efficiency Video Coding)是基于图像块的变换编码,由于变换系数的粗量化而产生严重的块效应和振铃效应,严重的影响了观看者的视觉体验。为了提
互联网技术的飞速发展,使得整个人类社会成为了一个地球村。但是现有的语言却将不同种族与地域的人割裂开来,成为了人类沟通的障碍,世界迫切呼唤新的语言出现。符号因其简单
为解决生产装置中出现的手动控制频繁、系统稳定性不高、自控率低等问题,专家学者们提出了许多先进控制技术,但是这些技术多数是需要基于精确对象数学模型的。系统辨识就是通