论文部分内容阅读
数据库技术的应用是以数据库管理系统为基础的,技术成熟、数据管理能力强、并发控制稳定可靠的特点使得关系数据库管理系统在各企业的数据管理中得到了广泛应用,而且,随着Web技术、网络技术和Internet的飞速发展,信息共享和数据交换的范围在日益扩大。但是企业及各种机构不断深入地进行信息化建设,必将带来应用范围不断扩展,软硬件资源的升级变化,系统环境也有可能发生变化,这就造成了多种关系数据库系统并存的异构问题。各关系数据库管理系统之间的异构及其操作系统的异构性,严重限制了各组织机构之间的数据共享和数据交换范围。传统的关系数据库面临着重大的挑战,新的应用系统也对数据交换和数共享提出了更高的要求。针对网络上各种异构数据源的信息共享和信息交换,各企业部门不同信息管理系统的异构数据交换问题,无论是国内外的专家和学者,还是应用软件开发商和数据库生产商,以及一些个人应用需要,他们都从理论或者实际应用两个方面进行了大量的研究工作和设计开发工作,并且取得了一定的成绩。他们提出的一些解决方法和开发出的交换工具在实际应用中得到了广泛的使用,并在目前的数据共享和数据交换中起到了很大的作用。前面我们所说的异构数据,它们的异构主要体现在系统异构、模式异构、逻辑异构上。系统异构是指数据所依赖的运行环境不同,包括计算机硬件、操作系统平台和网络连接等方面的不同,系统异构属于物理硬件上的异构;模式异构是指使用不同的数据库语言描述数据及其关系即采用不同DBMS;逻辑异构是指在数据的类型、语义上不同,模式异构和逻辑异构属于软件方面的异构。这些异构使得数据的利用和数据共享受到了阻碍。为了更充分地利用原有资源以及其他资源,不同的异构关系数据库进行交换和迁移是企业经常要面对的问题。总结一下,目前比较流行有以下几种方法:由各数据库生产商扩展和应用开发商开发的数据交换工具,有SQL Server和Oracle中扩展的数据复制工具;Microsoft在SQL Server基础上开发的SQL Server DTS;Oracle开发的SQL&Loader;Delphi的DataPump和PoweBuilder的Data Pipeline。隔离对数据库的直接操作,保持各数据库自治性的中间件技术。目前中间件技术中包括双向直接交换中间件和基于中心数据库的交换中间件两种技术。利用一种数据交换双方都能分析和操作的中间数据格式文档进行数据交换的中间数据法。中间数据法早期采用CVS格式文档作为中间格式,目前采用流行的XML作为中间数据格式。ADO.NET作为一种新的数据访问程序模型简化和优化了数据交换的操作。它将XML和ADO对象模型集成在一棵树状的类的集合中;在访问数据库时,可以随时与数据库进行连接,不需要长时间独占;还可以断开与记录集的连接,进行脱机处理。ADO.NET的新特性使得数据库资源可以得到有效地利用,为基于Web的数据共享和数据交换提供了方便,更能显著地提升应用程序的性能。异构数据库间数据交换的主要任务是消除数据的异构冲突,使交换双方的数据互为补充,以冗余存储方式达到数据库共享的目的。目前,XML所具有的平台无关性、良好的交互性、可扩展性、可格式化和语义性强等特性和优点,使得XML能够方便地描述关系数据库。XML已成为数据交换的标准格式,其固有的结构特征使其成为异构DBMS之间数据交换的最好选择,并在转换的过程中起到重要的桥梁作用。本文首先研究了异构DBMS数据交换的算法及关系数据库与XML的可逆双向转换,然后基于比较先进的ADO.NET 2.0和XML技术提出一个异构数据交换方法。在方法中,保留关系数据的实体完整性约束、参照完整性约束以及用户自定义的完整性约束,实现异构数据源之间的数据交换,并就异构数据源的数据交换设计和开发了一个简单易用的异构数据交换工具。在开发过程中,主要借助于ADO.NET 2.0的四个基本对象,特别是处理非连接的和数据源无关的DataSet类,DataSet类是存储在内存高速缓冲的虚拟数据库,使得在处理数据时高效、安全,并对关系模式和XML模式使用统一的表达模型,实现关系数据库到XML文档的双向数据交换。开发的数据交换工具屏蔽了数据库类型,能够较好的自动完成各种异构数据源之间的模式转换和数据交换;关系模式与XML的相互转换使得用户在Internet和Intranet上发布数据变得更加方便快捷,也为异构数据源在更高层次上的应用与集成提供了技术基础。本文最后选择SQL Server 2005、Access、MySQL三种样例,对设计方法的可行性进行了验证,实现了三种不同DBMS之间正确的数据交换以及关系数据库和XML之间的转换。本方法实现了数据转换过程的自动化、批量处理等特性,将会为信息交流和信息共享提供有价值的参考。原型工具在用户界面的友好性、数据交换功能的可扩充性和适应性方面还有待进一步的改进。