发布/订阅系统中基于树自动机的XML查询技术研究

来源 :江苏大学 | 被引量 : 0次 | 上传用户:wwwboy2000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,互联网技术的迅速发展和广泛应用极大地改变了分布式系统的规模。大型的分布式系统可以扩展至数百万节点,使得传统的同步紧耦合通信模型已不能满足需求。发布/订阅通信模型在时间、空间、控制流等方面完全解耦,很好地适应了大规模分布式系统的通信要求,因此成为大规模分布式环境下广泛使用的通信模型。   在发布/订阅通信模型中,基于XML的发布/订阅通信模型由于其灵活性及强大的表达能力,近年来得到了学术界和工业界越来越多的关注和研究。本文以XML作为事件模型,以XPath(XML Path Language)作为订阅模型,以树自动机理论为指导,提出一种基于树自动机的XML查询技术XTAFilter(XML Filtering based on Tree Automata)来处理XML数据流的查询,并根据树自动机的特点对XML查询进行优化,进一步提高XTAFilter技术的性能。其主要工作如下:   1)通过对树自动机理论的研究,依据树模式思想给出XPath与树自动机的转换算法,并基于树自动机导航实现对XML查询。   2)提出一种基于树自动机的XML查询技术XTAFilter。该技术基于XPath与树自动机的转换算法,通过结构匹配和内容匹配两方面实现对XML查询,并采用hash表来存储谓词信息的方法以提高XML查询效率。   3)提出一种基于树自动机的XML查询优化算法。该算法通过合并用户提交的多个订购表达式中相同的路径片段,构建共享路径树自动机,进一步提高XTAFilter技术的性能。   4)搭建原型系统,给出系统架构及主要功能模块,并基于原型系统进行仿真实验。实验结果表明,基于树自动机的XML查询及优化技术减少了XML查询的匹配转发次数,提高了XML查询的效率和系统的性能。
其他文献
计算机断层成像技术(Computed Tomography, CT)是与MRI、同位素扫描、超声图像等一样重要的医学图像诊断手段。与其他医学成像方法相比,CT成像具有检查方便、无痛苦无创伤、
随着数据库技术的成熟和知识发现等领域技术的不断发展,数据挖掘技术应运而生,并在越来越广阔的领域得到应用和发展。粗糙集方法是一种重要的数据挖掘方法,是由波兰科学家Z.P
随着Internet的不断发展,信息过载和资源迷向已经成为制约人们高效使用Internet信息的瓶颈。人们希望网页的内容能够尽可能地根据用户的浏览兴趣自动调整,从而使每个用户感觉
在计算机技术高速发展的信息时代,人们越来越多的学习、工作和生活都在依赖于计算机软件系统的正常运行,软件在现实社会中扮演着越来越重要的角色。但是现有的软件技术并不能
对等网络(P2P)产生的流量消耗了大量网络带宽资源,对网络运行造成了巨大压力,而且P2P流量快速增长导致跨ISP域流量不断增长,增加了ISP的运营开销,因此P2P跨域流量控制问题已
关联规则挖掘是从大量数据集中挖掘出潜在的知识,这就可能把涉及到个人隐私的信息挖掘出来,从而产生了隐私保护下的关联规则挖掘。因而,如何在关联规则挖掘的过程中解决好隐
随着互联网的飞速发展,恶意代码数量依然持续增长,对于恶意代码的分析研究依然处于信息安全的主要位置。为此,学术界学者对恶意代码检测、聚类、分类以及同源等方面的进行了
大数据背景下,行业应用数据呈爆炸性增长,统计分析的数据规模和处理复杂度不断增加,传统意义上的计算技术和信息系统的处理能力远远不能满足用户要求。随着高性能计算平台的
随着交通科技的进步和道路交通管理及设施的不断提高和改善,加上人们对交通出行的要求越来越高,智能交通系统(ITS,Intelligent TransportationSystem)得到了前所未有的关注和
随着信息科学技术的高速发展,人们对海量信息存储的需求日益增长, CPU的处理速度和存储设备I/O处理速度之间的差距越来越大,磁盘I/O成为影响计算机系统性能的主要因素。为了