论文部分内容阅读
随着Internet的迅速发展,XML逐渐成为互联网上信息存储和交换的事实标准。XML以其语言自身的规范性、灵活性、可扩展性以及强大的语言表达能力,在诸多的领域得到广泛的应用,诸如数字图书馆、电子商务等。届时,互联网上将会有大量的XML数据信息。因此,如何高效的存储管理XML数据信息,是一个很有研究价值和应用前景的课题。 本文从数据存储与更新、数据查询的角度来考虑系统的实现,研究重点放在数据存储和数据索引两方面。 对于数据存储,采用基于模型的原生XML存储方法,数据模型为树模型,以B树作为存储结构,底层存储采用面向对象的存储管理系统。此外,为了改进存储的更新性能,对每个元素节点对象进行标识,该标识既可以作为元素对象的逻辑引用,又可以作为B树的键。 对于数据索引,采用改进的分层Patricia Tries索引作为主索引,用于对XML数据层次进行导航,并且对XML文档的结构和内容同时进行索引。此外,为了解决主索引对于相对路径查询需要大规模遍历的问题,我们设计了模式路径哈希表作为辅助索引,用于在主索引执行相对路径查找之前计算相对路径查询的绝对路径,使主索引的遍历负荷大大减轻,从而使相对查询的效率提高。