基于扩展Dewey码的XML查询技术的研究与实现

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:linxiong12
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Internet的应用越来越广泛,XML已经成了Internet上数据描述和数据传输事实上的标准。XML具有良好的可读性;具有开放性和可扩充性;能够描述复杂的数据;XML成功实现了内容、结构和表现三者的分离:并且具有平台无关性和国际化等特点。由于XML具有这些不同于传统数据形式的特点,对XML数据的存储和查询也与传统数据库有不同的要求。 查询是数据处理最重要的问题之一,对XML也是如此。为了实现高效的查询,本文着重研究了决定XML数据查询的两个关键问题,即XML结点编码方式和结构连接算法。能够快速判断XML文档树中任意两节点之间的基本结构关系是XML路径查询的基本要求。目前,大部分XML查询技术都是基于对XML文档树的某种编码方案。本文在研究了现有的结点编码方式之后,在前缀编码Dewey的基础上进行了修改,提出了XSQS系统编码方式。通过采用扩展的Dewey编码可以得到从根到该结点路径上的所有祖先节点名。 作为XML查询处理的核心操作,结构连接操作的设计与实现是提高查询处理效率的关键。在扩展Dewey编码的基础上,我们提出了一种结构连接算法PFMatching。与之前所有基于区间编码的结构连接算法不同,PFMatching只需要访问查询树叶子节点上的编码,然后对查询树路径进行匹配,就可以迅速判断出结点是否符合查询要求。这种方法可以降低磁盘访问次数,提高查询效率。 为了更好的研究Native XML数据库系统,同时也为了验证本文提出的结构连接算法,在扩展Dewey编码和PFMatching算法的基础上,设计和实现了Native XML数据库原型系统XSQS(XML Storage and Query System),主要实现了其查询系统部分。 本文最后以人工数据集XMark和真实数据集DBLP对PFMatching算法和XSQS查询系统的效率进行了实验测试,实验结果表明PFMatching算法对分支较少和父子关系的查询有着较高的效率。
其他文献
信息社会中信息资源就像空气一样不可缺少,成了最重要的社会资源,信息资源共享和利用是信息化社会的必然趋势。资源库的建设为信息资源共享提供了渠道。 近年来,资源库得
物联网的快速发展在给人们带来便利的同时,也带来了极大的安全隐患。本文在分析传统物联网网络安全保障技术缺陷的基础上,利用虚拟化技术提出了更适合于物联网服务运行环境的
产品特征码自动识别技术是在自动化生产的一个崭新的应用。在生产当中经常有产品和产品的特征码不符的情况发生,所以在产品入库之前必须要进行检查。目前产品这项工作都是由
复杂区域刺绣算法是刺绣CAD系统中的核心算法之一。该算法用于为刺绣花样中包含的复杂区域进行自动编针。 近年来,有很多针对该算法的研究,使算法效率由低到高,功能日臻完
字符是电脑刺绣CAD系统中使用率很高的一种图案,随着计算机技术、机械制造技术、CAD技术的发展以及人们对字符绣品的要求日益提高,字符自动编针算法在刺绣CAD系统中的地位显
随着我国经济的快速发展,流动人口和汽车数量正在以前所未有的速度增加,以手工录入为主的传统人口和交通管理系统难以胜任,智能人口和交通管理势在必行。汽车牌照识别和证件
近年来随着Internet的飞速发展,网络安全正面临着越来越严峻的挑战。传统的防御策略,诸如防火墙、加密、身份认证以及访问控制、操作系统加固等静态安全防御策略已经无法满足
目前数据文件合并系统朝着“物理上分散,逻辑上集中”的这种趋势发展,分布式数据文件合并系统应运而生。在分布式数据文件合并系统中,任务分配与调度在很大程度上决定着整个