论文部分内容阅读
随着个人机和计算机网络的快速发展,各种计算资源像燎原烈火一般,燃遍信息世界的每一个角落。各种应用的核心——数据,以不同的形式存储在不同的系统中,呈分布、异构和自治状态。同时,这些信息源的可共享性、共享方式、共享内容等也可能随时发生变化。
在此背景下,人们提出了虚拟数据库(virtual database,VDB)的概念。它把各个分散数据源处的数据收集集成并结构化,将异质的数据转化成统一格式,并给应用程序的设计者提供一个简单、统一的关系数据库接口。 VDB技术使应用程序可在分散的数据上进行功能强大和统一的查询工作,使建立在所有的不同数据源上的应用程序可以在Internet上得到广泛地发展和应用。
基于对信息集成理论的研究,本文提出了虚拟数据库系统原型XVDB的系统架构,并在这一架构中对XVDB系统的元数据管理和查询处理技术进行了研究和实现。
元数据管理技术负责管理与数据和数据源相关的数据,提供用户所看到的对象-关系数据与XML、网页、邮件等不同格式的数据之间的转换,是解决异构数据集成、实现VDB所有操作的基础。本文设计了一种基于CWM的元数据管理模型,作为一种集中式元数据管理模型,它同时具有较高的可扩展和重用性。文中详细介绍了该模型的元数据描述、存储以及管理等实现技术。
查询处理技术用于处理在VDB系统中使用的查询和管理命令,实现对命令的解析和执行等操作,是系统的关键部分。本文首先基于传统的SQL语法,设计了一种适用于虚拟数据库环境的可以对外部数据源进行管理和访问的语言XVDB-SQL,并实现了对它的解析和执行。此外,本文还对XVDB-SQL语言进行了语义相关的扩展,借助语义使用户可以更准确的描述查询请求和快速获取数据。