论文部分内容阅读
XML自1998年由W3C提出之后,已经成为因特网上数据表示和数据交换的新标准,各行各业都在使用XML描述本领域信息,随着XML文档的急剧增加,如何有效存储、管理和查询这些XML数据成为当前XML领域的一个研究热点,也是数据库领域的一个新的研究方向。本文主要讨论基于关系数据库的XML存储和查询技术。本文首先讨论基于关系数据库的XML存储技术,在介绍完典型的XML-RDB映射方法之后,对几种改进的存储方法进行了深入分析。典型的映射方法包括边模型映射、结点模型映射、结构映射以及约束映射。改进的存储方法中重点讨论了X-RES7ORE方法、基于E Schema的映射方法以及基于扩展哈夫曼编码的XML存储模型。基于以上的研究,结合线索二叉树的思想,本文提出了线索多叉树(Threading-Numerous-Tree)的概念,运用线索多叉树的原理,本文提出了基于Threading-Numerous-Tree的XML存储模型。该模型能有效解决基于哈夫曼编码的XML存储模型中,随着XML树的深度增加,编码实现困难的问题。在介绍完存储技术后本文探讨了XML索引和查询若干关键技术。根据响应查询和处理查询的方式将索引分为结构概要索引、结点编码索引和整体索引,并分别对它们进行研究。在此之后,对XML查询关键技术:XPath查询处理技术、XQuery查询处理技术、以及XML-to-SQL查询转化技术进行了深入分析。因为结构连接算法在XML查询中的重要性,本文对其中的父子关系以及兄弟关系进行了研究与改进,改进的算法基于本文提出的Breadth-Depth存储模型,采用深度查询和广度查询相结合的搜索策略。为了解决XML中用户书写表达式困难的问题,本文提出了利用本体模式表示XML查询条件的思路。最后将XML存储和查询运用到古代建筑领域,提出了XML存储和查询实现的系统架构,并对主要的实现过程进行详细而深入的分析。并且基于古代建筑领域数据的特点提出了基于全路径搜索的和基于领域本体的查询优化方案。