基于宏森林自动机的XML流数据查询技术

来源 :北京工业大学 | 被引量 : 5次 | 上传用户:cmccetehi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
可扩展标记语言XML是一种半结构化的数据描述语言,因其具备高可读性、跨平台性和可扩展等特性,在互联网领域被广泛应用。XML不仅是一种优秀的数据存储格式,而且还是互联网中数据共享和交互的一种标准。针对XML数据的查询匹配算法一直是数据库领域的研究热点。近年来,网络在各行业和人们日常生活中快速普及,网络中应用的数量急速增长。很多基于网络的应用系统会持续地自动产生大量细节数据,例如气象实时分析、金融交易日志、互联网安全监控等系统。随着网络中数据交换量的激增,“XML流数据”受到了研究者们普遍关注。从流数据一次存取、持续处理、有限存储和快速响应等处理要求可知,人们从持续到达的海量数据中识别出有价值的少量数据,不仅需要丰富的查询功能和强大的查询处理能力,而且应该避免占用过多系统资源,但现有的大部分面向传统XML数据库的查询机制,并不适用于XML流数据,这给XML查询处理提出了新的需求和挑战。因此,研究针对XML流数据的查询处理算法就变得尤为重要。基于宏森林自动机的XML流数据查询算法被认为是最优秀的XML流数据查询算法之一,本文提出一种根据XPath查询构造宏森林自动机的方法,该方法支持范围覆盖了XPath查询的核心部分,如PC轴、AD轴、任意多重谓词和任意层次的嵌套谓词。通过实验证明,本文提出的方法扩展了查询的支持范围,同时根据该方法构造的自动机状态数目和查询的复杂度线性相关,不仅可以正确地查询出目标结果,而且算法具有很高的执行效率。
其他文献
现如今,越来越多的探索和遥感卫星被发射升空,这些航天器大多搭载了遥感成像设备,而且成像设备的精度也大大增加,由此产生的大量图像数据以及有限的数传带宽对星载图像压缩设备的能力提出了更高的要求。本文研究了CCSDS图像压缩标准,一种专门为星上图像压缩解压而设计的图像压缩标准,并提出了增强其并行处理能力的改进方法。图像压缩算法主要有2个阶段:小波变化和位平面编码。本文的主要工作为:(1)详细分析了CCS