基于空间分解的路径多维索引查询方法研究与实现

来源 :中山大学 | 被引量 : 0次 | 上传用户:fanjing0
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
XML作为一种数据描述语言,由于其内容与形式分离、易扩展、和易移植的特点,已经成为广泛应用的数据交换标准。基于XML的数据查询十分频繁,如何提高XML数据查询效率也一直是领域研究热点。XML数据索引的性能是决定其查询效率的关键因素,路径多维索引(Universal B+-Tree,简称UB-Tree)是一种将路径转化为空间地址,进而实现对数据进行多维管理的索引结构,由于其摆脱了原有的路径匹配只能基于字符串匹配的特点,逐渐成为XML数据索引的一个重要实现技术,其中区域查询算法的效率以及区间存储方式是该技术中的重要研究课题。   目前已实现的具有代表性的XML路径多维索引方法是的UB-Tree方法(Universal B+-Tree)。UB-Tree方法存在两个问题:1)索引树中的节点记录一个区间,但数据分布的无规律性使得区间内通常只有少量数据点,对数据查询的效率造成很大影响;2)在数据查询时无法避免对空数据区间的遍历。以上两个问题显著影响UB-Tree方法查询的效率。   本文的研究拟对以上两个问题进行改进。首先,针对存储空间使用率不高,存在大量无数据区间的问题,本文在以区间段存储取代原有的区间分割地址储存方式的基础上,采用改进的边界区间存储方式对批量数据进行存储,有效提升了空间的有效利用,并减少了存储结构中对无数据区间的保存开销;其次,针对数据查询存在的效率问题,本文在Tomas Skopal等人提出的基于区间相交性判断的改进DRU区域查询算法基础上,采用空间分解的方法对查询区域进行有效的分解,同时建立缓存用于存储公共路径,减少对相同节点的重复访问。实验结果表明,基于改进数据存储方法的空间分解查询算法在查询效率以及区间使用率方面都较原UB-Tree方法有不同程度的提高。
其他文献
由于用户需求和运行环境会不断的变化,软件系统在运行过程要不断地更新,这导致了软件演化性的不断增强,因而演化性也成为了软件的本质属性。目前软件演化主要分为两类:静态演
随着国家城市化进程的推进,机动车数量快速增长,城市道路的建设不能满足机动车快速增长的需求,使得交通网络日趋复杂,导致交通事故频发。在信息时代来临时,交通运输领域的研
延迟容忍网络(DTN/Delay Tolerant Network)是一种特殊的网络。由于节点能力受限,物理链路不存在持续、双向的端到端路径,往返延迟长,数据速率不对称,误码率高等特征,在Internet网
随着移动互联网和O2O的快速发展,移动支付行业已经成了目前最具前景的朝阳行业,无数的科技公司、企业机构对其趋之若鹜。通过使用移动支付技术,人们免去了现金交易带来的麻烦
近年来,随着移动智能设备的迅猛发展,越来越多的移动应用比如基于位置信息的社交网络应用,开始广泛存在于日常生活中。这些资源需求巨大的移动应用给资源不足和电池容量有限的移
现代浏览器记录了用户浏览访问Web的历史。这些记录通常被用来帮助用户进行“重访问”a。同时,这些记录蕴含了丰富的用户特征和偏好,因此还可以用来帮助用户在Web上进行协同工
随着信息时代的来临,社会对软件的需求迅速增长,各种类型的、复杂多变的软件与日俱增,而这些软件大部分是用高级语言编写的,但绝大部分软件产品只提供可执行的程序,即通常意
集中抄表系统是一个集现代化管理、计算机应用、现代通讯技术、自动控制、信息等多学科技术于一体,实现电力营销监控、电力营销管理、营业抄收、数据采集和网络连接等多种功
随着网络上视频数量的增长,网络视频中往往存在着大量重复的(duplicate)或近似重复的(near-duplicate)视频。这些大量的重复视频不仅浪费了存储空间,也给视频的有效管理带来不
手机自发明以来,行业的快速发展已经使得手机已经超出了传统通讯工具的限制,如现在可以用手机浏览网页,收发邮件,GPS等。手机软件的发展使得测试变的越来越棘手,这就成为了一个值