论文部分内容阅读
XML以其强大的数据表达能力,事实上已经成为Internet上数据表示和交换的标准。由于XML数据中保存了大量有用的信息,我们需要一种高效的XML查询技术,来获得这些信息。
现有的XML查询技术主要有两种,一种是基于关系数据库的XML查询技术,另一种是纯XML的结构化联接技术。本文考虑了两种技术各自的优缺点,并从XML数据和查询集的特点出发,提出一种新的XML存储方式——混合映射方式,即将一部分XML数据以关系元组的形式存储在关系数据库中,一部分XML数据以纯文本的方式存储,并分别用关系数据库技术和结构化联接技术对这两部分数据进行查询,使得给定查询集具有最优查询代价。为了根据XML数据和给定查询集得到具有最优查询代价的混合映射模式,本文还提出了一个代价估算模型,以及基于该模型的混合映射模式生成算法。
本文还借鉴集合数据查询中的树型索引技术,提出将XML数据中枚举类型的数据以纯文本的方式存储,并将一棵子树下的多个枚举类型元素/属性看作一个集合,利用树型索引技术对它们建立索引。本文还提出了适用于XML查询的基于该索引的查询算法。
最后,本文还实现了一个基于关系数据库的XML查询系统,它是国家863项目“web数据库新技术”中的一部分。