支持动态更新的XML编码方法及小枝模式查询算法研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:dengxiaofei317
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数据库和网络技术的迅速发展,XML已经成为网络上信息表达和数据交换的事实标准。随着XML数据的不断增长,尤其是大规模XML数据的出现,如何对这些XML数据进行有效的管理和查询成为当前的研究热点。由于XML文档具有的半结构特性,使得传统的针对关系数据库的查询算法对其不再适用,因此如何高效地存储和查询XML数据成为新的研究课题。   对于XML结构查询,可以通过对XML文档树中的结点或边进行编码,根据编码直接判断结点之间的结构关系,而无需对原XML文档树进行遍历,从而将XML结构查询的计算转化为结构连接的计算。目前对XML文档的编码方法主要有区间编码、路径编码等。同时,随着不同编码方案的研究,各种相应的结构查询算法也提了出来。对于XML文档基于结构连接的小枝模式匹配查询,是从文档树中查找与查询模式匹配的结点,然后将查找到的匹配结果再组装成最终符合查询表达式的完整树结构。   本文首先针对已有XML编码机制时空效率不高、对XML文档动态更新支持不够的问题,结合前缀编码机制的思想,提出了一种新的XML文档树编码方案-EBCL编码,该编码方案不仅能完全高效地支持XML文档动态更新、具有较好的查询效率,而且大大降低了空间成本。   另外,针对已有小枝模式查询匹配算法或基于归并有很高计算代价或非常复杂的问题,尤其是在考虑了大部分查询表达式中只有一个结点是最终的输出结点这个特点基础上,提出了一种新的XML小枝模式查询匹配算法TwigDirect。该算法和以往大部分的小枝模式查询算法不同,它不是从根结点开始查询匹配,而是直接以输出结点为导向,自底向上逆向到根结点匹配,不需要归并,能够在扫描更少的有效数据结点的情况下得到最终满足查询的匹配结果。
其他文献
现在社会已经处于并将长期处于大数据时代,海量数据具有4个V的特点,即数量大(Volume),多样性(Variety),需要处理的速度快(Velocity)和真实性(Veracity)。虽然目前的数据量很
煤场储煤量的盘点是火电厂燃煤管理的一个重要组成部分,关系到火电厂煤耗的计算和经济性指标。目前国内大多数火电厂仍采用人工盘煤的方法测量煤场的储煤量:即先用推煤机整形
在数字共焦显微技术中,为了获得物镜与载物台数十纳米的相对步进位移,需要通过驱动物镜与载物台的相对步进微位移,采集一系列不同截面的生物细胞的序列切片图像。而采用压电陶瓷
随着计算机网络和现代经济的发展,视频监控已近广泛渗透到了人们生活的各个方面,成为保障人们公共安全,打击违法犯罪,防止自然灾害发生的重要手段。运动目标检测作为视频监控
无线传感器网络是一种由大量廉价的传感器节点组成的多跳自组织网络。它的出现,极大地拓宽了人们获取信息的渠道,把客观世界的物理信息通过无线网络进行传输,给人们传递最直
近年来,随着高空飞行器技术和卫星技术的发展,以及侦察机和侦察卫星在军事领域的广泛运用,对伪装技术的要求也越来越高,特别是迷彩伪装,它已经成为一种对抗军事侦察和军事武
系统发育分析是生物信息学研究的重要领域之一,它主要研究同源的DNA或蛋白质序列,对这些序列进行进化分析,从而得到能够反映蛋白质序列或者DNA序列之间进化关系的系统发育进化树
自20世纪60年代以来,数据库技术开始被广泛地应用于国家政府机构、商业部门和科研机构等领域。随着时代的发展,特别是互联网技术的出现,这些领域的数据库的数据呈现近乎几何
随着物流产业的飞速发展,物流应急问题随之而来。如何制定有效的应急处理方案,及时处理突发事件,将事件造成的影响和损失控制在最低限度,已成为物流应急领域亟待解决的问题。
可再生能源的综合利用对我国社会经济的可持续发展和环境保护起着重要的作用。太阳能和风能是可再生能源中利用比较广泛的两种。太阳能和风能在资源条件和技术应用上都有很好的互补特性,在电能作为能量主要能量消耗形式的当今社会,综合考虑太阳能和风能在多方面的互补特性而建立起来的风光互补发电系统是一种经济合理的供电方式。该供电方式在解决边远地区的能源供应问题中发挥着积极的作用。由于风能和光能的随机性、间歇性,为满