论文部分内容阅读
XML技术从诞生之日就预示了它辉煌的未来,特别是随着近一、两年WebService的蓬勃发展,XML越来越多地活跃在数据交换和存储领域。XML数据量指数级的增长,要求更有效的数据管理能力和更快、更精确的查询。 在如何处理XML数据的技术上,形成两大阵营:XML-Enabled DBMS(XED)和Native XML DBMS(NXD)。XED是在原有数据库基础上扩展了XML支持模块,完成XML数据和数据库之间的格式转换和传输。NXD则出现在XML数据处理领域内,一般采用层次数据存储模型,保持XML文档的树形结构,省掉了XML文档和传统数据库的数据转换过程。 虽然Native XML DBMS(NXD)已崭露头角,打破了RDBMS传统数据库一统天下的局面,并取得了较快的市场增长速度,获得了许多市场份额。但由于在XML文档世界中存在两种类型的文档,一种是“以数据为中心的文档”,另一种是以“文档为中心的文档”。虽然在Web上大量出现的XML文档属于后一种类型的文档,这种类型文档特点是半结构化和非结构化,XED对这种类型文档的处理有些力不从心。但现在信息处理中用到的许多XML文档,如航班信息、销售定单、科学计算结果等,这种文档的数据一般由机器产生,来源于传统数据库中的数据,这种文档则属于“以数据为中心”的文档。这种文档则非常适合XED处理。同时由于NXD在事务、数据恢复等传统数据库技术方面还未得到时间的检验,因此对数据安全要求较高的一些应用,如银行、金融系统的数据库,所以对此类文档的处理建立在传统数据库上的XED相对来说更有优势。 本文就关于XED的实现策略作了相关讨论,提出了一个新的存储方案,并给出了基于此种方案的XML数据操作方法。本方案的提出主要基于作者参与开发的通用数据实验平台。 通用数据实验平台参照数据库系统的体系结构设计,采用模块化结构实现,能提供通用数据库系统的数据定义,数据操作等服务。通用数据平台设计时参照多种数据库的体系结构,使它不仅能支持关系数据的存储,而且利用其