基于扩展Dewey码的XML查询技术的研究与实现

来源 :华南理工大学 | 被引量 : 0次 | 上传用户：linxiong12

【摘要】

：

随着Internet的应用越来越广泛,XML已经成了Internet上数据描述和数据传输事实上的标准。XML具有良好的可读性；具有开放性和可扩充性；能够描述复杂的数据；XML成功实现了内容、结

【作者】

：

吴鹏

【机构】

：

华南理工大学

【出处】

：

华南理工大学

【发表日期】

：

2008年期

【关键词】

：

XML标准 XML标准查询技术查询技术结构连接算法结构连接算法XML数据库 XML数据库

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着Internet的应用越来越广泛,XML已经成了Internet上数据描述和数据传输事实上的标准。XML具有良好的可读性；具有开放性和可扩充性；能够描述复杂的数据；XML成功实现了内容、结构和表现三者的分离：并且具有平台无关性和国际化等特点。由于XML具有这些不同于传统数据形式的特点,对XML数据的存储和查询也与传统数据库有不同的要求。查询是数据处理最重要的问题之一,对XML也是如此。为了实现高效的查询,本文着重研究了决定XML数据查询的两个关键问题,即XML结点编码方式和结构连接算法。能够快速判断XML文档树中任意两节点之间的基本结构关系是XML路径查询的基本要求。目前,大部分XML查询技术都是基于对XML文档树的某种编码方案。本文在研究了现有的结点编码方式之后,在前缀编码Dewey的基础上进行了修改,提出了XSQS系统编码方式。通过采用扩展的Dewey编码可以得到从根到该结点路径上的所有祖先节点名。作为XML查询处理的核心操作,结构连接操作的设计与实现是提高查询处理效率的关键。在扩展Dewey编码的基础上,我们提出了一种结构连接算法PFMatching。与之前所有基于区间编码的结构连接算法不同,PFMatching只需要访问查询树叶子节点上的编码,然后对查询树路径进行匹配,就可以迅速判断出结点是否符合查询要求。这种方法可以降低磁盘访问次数,提高查询效率。为了更好的研究Native XML数据库系统,同时也为了验证本文提出的结构连接算法,在扩展Dewey编码和PFMatching算法的基础上,设计和实现了Native XML数据库原型系统XSQS(XML Storage and Query System),主要实现了其查询系统部分。本文最后以人工数据集XMark和真实数据集DBLP对PFMatching算法和XSQS查询系统的效率进行了实验测试,实验结果表明PFMatching算法对分支较少和父子关系的查询有着较高的效率。

其他文献

基于本体的资源关联检索的研究

信息社会中信息资源就像空气一样不可缺少,成了最重要的社会资源,信息资源共享和利用是信息化社会的必然趋势。资源库的建设为信息资源共享提供了渠道。近年来,资源库得

学位

资源库资源库关联检索关联检索系统设计系统设计文档管理文档管理

面向虚拟化的物联网可靠性保障系统网络保障方案的研究与实现

物联网的快速发展在给人们带来便利的同时,也带来了极大的安全隐患。本文在分析传统物联网网络安全保障技术缺陷的基础上,利用虚拟化技术提出了更适合于物联网服务运行环境的

学位

物联网网络安全虚拟化隔离

流水线上产品特征码的识别研究

产品特征码自动识别技术是在自动化生产的一个崭新的应用。在生产当中经常有产品和产品的特征码不符的情况发生,所以在产品入库之前必须要进行检查。目前产品这项工作都是由

学位

流水线生产流水线生产区域定位区域定位产品特征码产品特征码自动识别系统自动识别系统字符识别算法字符识别算法

复杂区域刺绣算法设计与应用实现

复杂区域刺绣算法是刺绣CAD系统中的核心算法之一。该算法用于为刺绣花样中包含的复杂区域进行自动编针。近年来,有很多针对该算法的研究,使算法效率由低到高,功能日臻完

学位

CAD软件CAD软件刺绣花样刺绣花样路径搜索路径搜索复杂区域算法复杂区域算法自动编针自动编针

英文字符自动编针算法的设计与应用实现

字符是电脑刺绣CAD系统中使用率很高的一种图案,随着计算机技术、机械制造技术、CAD技术的发展以及人们对字符绣品的要求日益提高,字符自动编针算法在刺绣CAD系统中的地位显

学位

电脑刺绣电脑刺绣CAD系统CAD系统TrueType字体TrueType字体字符图像字符图像自动编针自动编针欧拉回路算法欧拉回路算法

基于立体视觉的牌照与证件识别方法研究

随着我国经济的快速发展,流动人口和汽车数量正在以前所未有的速度增加,以手工录入为主的传统人口和交通管理系统难以胜任,智能人口和交通管理势在必行。汽车牌照识别和证件

学位

立体视觉立体视觉牌照定位牌照定位证件识别证件识别边缘检测边缘检测字符识别字符识别图像处理图像处理

IPv6下入侵检测系统的研究与实现

近年来随着Internet的飞速发展,网络安全正面临着越来越严峻的挑战。传统的防御策略,诸如防火墙、加密、身份认证以及访问控制、操作系统加固等静态安全防御策略已经无法满足

学位

入侵检测系统入侵检测系统网络安全网络安全安全防御安全防御防御策略防御策略下一代网络下一代网络IPv6协议IPv6协议

分布式数据文件合并系统任务调度的研究与设计

目前数据文件合并系统朝着“物理上分散,逻辑上集中”的这种趋势发展,分布式数据文件合并系统应运而生。在分布式数据文件合并系统中,任务分配与调度在很大程度上决定着整个

学位

消息中间件消息中间件事务处理事务处理异步消息传输异步消息传输任务调度任务调度优先级设置优先级设置

基于扩展Dewey码的XML查询技术的研究与实现

其他学术论文