如何进行XML的异构数据库数据的转换

来源 :硅谷 | 被引量 : 0次 | 上传用户:chongyou2026
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:随着政府和企事业单位信息化办公需求的增加以及数据库技术的不断发展,在数据库技术领域出现异构数据库的问题,也正是由于异构数据库问题不能得到有效的处理才严重制约企业信息化管理中不同业务部门之间的数据的交换和共享。然而基于XML技术的异构数据库数据转换技术可以有效实现这些不同结构类型数据源的转换整合,可以从根本上解决不同结构类型数据库数据的兼容问题。从对异构数据库的概述谈起,然后对异构数据库数据的转换进行详细的说明,最后就XML异构数据库数据转换的实现进行系统的分析和说明。
  关键词:XML;异构数据库;数据转换
  中图分类号:TP311.13 文献标识码:A 文章编号:1671-7597(2012)0510174—01
  0 前言
  与其他数据库相比,XML数据库具有跨平台、容易扩展、语义性强和人机交互效果好等特性,这些特点使得XML广泛的应用于异构数据库数据的转换。基于XML的异构数据库数据交换模型能够比较容易地实现数据源之间的数据转换以及对各异构数据库的描述,从而可以有效解决当前进行异构数据库数据转换过程中存在的联邦查询优化欠缺等一些相关问题。
  1 认识XML和异构数据库概述
  1.1 XML概述
  XML的英文全名为Extensible Markup Language,即可扩展标记语言,它是用于标记电子文件使其具有结构性的标记语言,可以用来定义数据类型和标记数据,是一种允许用户对自己的标记语言进行定义的源语言。XML属于SGML即标准通用标记语言的范畴,广泛应用于网络的传输。XML提供统一的方法来描述和交换独立于应用程序或供应商的结构化数据。
  与Access、Oracle和SOL Server等数据库不同,XML数据库提供了更强有力的数据存储和分析能力,基于XML数据库不能实现数据索引、排序、查找以及相关一致性等功能,她仅仅可以进行数据的展示。事实上XML与其他数据表现形式最大的不同是,就是XML数据库非常的简单。这是一个看上去有点琐细的优点,但正是这点使XML与众不同。
  1.2 异构数据库概述
  异构数据库系统是相关的多个数据库系统的集合,可以实现数据的共享和透明访问,每个数据库系统在加入异构数据库系统之前本身就已经存在,拥有自己的数据库管理系统(DataBase Management System,DBMS)。异构数据库的各个组成部分具有自身的自治性,实现数据共享的同时,每个数据库系统仍保有自己的应用特性、完整性控制和安全性控制。异构数据库系统的异构性主要体现在计算机体系结构的异构、基础操作系统的异构、DBMS本身的异构几个方面。本文中讨论的异构数据库是在不同DBMS的两个异构数据库系统间进行信息交流。
  1.3 XML与异构数据库的关系
  在进行异构数据转换时,如果没有统一的数据交换标准,实现异构数据的转换就显得非常的困难。在XML技术出现之前,在进行异构数据转换时,由于缺少统一的数据交换标准,使得这些异构的数据源只能散乱孤立地存在,进而使得不同行业的数据难以实现共享。只有采用统一的数据交换格式,才能实现数据的自动处理等功能。XML技术的应用,使得不同行业异构数据库的数据的转换和共享变得方便。以至于使XML技术出现以后,就不断地被应用到各种异构数据库数据的交换中去。
  2 异构数据库数据转换说明
  异构数据库数据转换是一种实现不同数据结构类型数据整合的一种技术,异构数据库数据转换技术的实现可以有效实现系统间的数据共享以及业务协同等,从而有效提高系统的工作效率。
  2.1 关于异构数据库数据转换
  所谓的异构数据库数据转换就是借助一些设备如磁盘、网络硬盘等其他数据存储介质来实现在不同的操作系统、硬件平台以及应用软件之间具有不同数据结构类型数据的转换过程。就当前来看,比较常用的数据转换方法主要有如下三种:
  1)使用一些数据库厂商提供的专业的数据转换工具来实现数据的转换,这种方法的特点是简单易于实现,缺点是有针对性,而且成本也较高。
  2)通过开放数据库互连即ODBC以及Java数据库连接即JDBc等其他的一些接口连接技术来实现数据的转换,这种数据转换方法比较适用于那些数据量较小的数据库进行数据转换的操作。
  3)是基于XML技术的数据转换方法,这是当前应用最为广泛的一种数据转换方法,而且该方法几乎适用于所有的平台。
  2.2 异构数据库数据转换的过程
  异构数据库的数据转换过程主要包括数据抽取过程、数据转换过程以及数据传输与接收这三个主要的过程。
  1)数据抽取过程
  基于XML技术的数据转换方法中的数据抽取数据方式主要有以下三种:一是数据库,主要指用于存储各种业务关系和业务数据的数据库系统,可以通过ODBC或JDBC接口访问技术来实现数据抽取操作;二是文件,主要指用于存储相关数据信息的文件,使用文件方式进行数据抽取时需要参照原来定义的文件规范来进行数据访问;三是XML文档,这是一种通过连接不同结构类型的数据源,在对这些数据进行分析处理的基础上,得到这些异构数据交换的数据信息,结合相关的数据信息来完成数据的抽取操作。
  2)数据转换过程
  在实现数据转化的过程中,需要将其中的一个数据源移动到另外一个数据源中,这样一来,就会造成其中一个数据源数据类型的转变。也可以说,数据转换的过程就是转换数据类型的过程,其中当前常用的数据转换类型主要有重构、替换、数据类型转换以及日期和时间格式的转换等几种,需要根据实际需要来进行选择。
  3)数据传输与接收过程
  在基于XML技术的异构数据库的数据转换时,数据的传输与接收过程是非常重要的,其中消息是传输的主要内容,而消息则是由那些待处理的数据以及数据自身所具有的属性所组成的,其中消息的传输采用的是XML格式,而且消息多以字节流的形式进行传输,因此基于XML技术的异构数据库的数据转换中传输与接收的数据并没有大小的限制。
  3 XML异构数据库数据转换的实现
  3.1 数据库操作模块设计
  对异构数据库中数据操作的实现是实现基于XML技术的异构数据库的数据转换的前提条件,其中数据库操作模块的设计主要包括数据库的连接与查询以及数据插入、删除和修改等操作功能的实现。
  3.2 数据抽取模块设计
  基于XML技术的异构数据库的数据转换的实现是以数据抽取模块为基础的,其中数据抽取模块主要用来获取源数据库中那些待转换数据的结构类型等相关信息以及目的数据库的结构信息等,从而为实现源数据类型向目的数据类型的转换做好准备。
  3.3 数据转换模块设计
  基于XML技术的异构数据库的数据转换方式包括合并式数据转换和迁移式数据转换两种不同的数据转换方式,其中当目的数据库为空时,需要采用迁移式数据转换方式,来实现源数据类型向目的数据类型的转变。如果目的数据库不为空时,需要采用合并式数据转换方式,来实现源数据类型向目的数据类型的转变。
  3.4 数据写入模块设计
  数据写入模块的功能就是按照数据转换时所设置的源数据类型与目的数据类型之间的对应关系和相应的数据转换方式,来将源数据库的数据写入目的数据库中,进而实现最终的数据转换。
  4 结论
  鉴于XML在进行异构数据库数据转换的优势,以至于很多相关行业都在积极制定适合于本行业的XML数据的规范,这就使不同行业内数据的共享变得更加容易。
  参考文献:
  [1]胡球,XML实现异构数据库间转换的实现与分析[J].科技论坛,2006(10).
  [2]杜邵敏,基于XML的异构数据库数据转换技术的探讨[J].通化师范学院学报,2009(02).
  [3]王沛,一种基于XML的异构数据库数据转换方法[J].西安邮电学院学报,2009(06).
其他文献
摘要:在旅游溶洞景观灯光工程中所用灯具,因环境特别复查灯具的效果、寿命等对建设者、设计者和生产灯具厂家都是一道重要的课题。  关键词:LED;防水;散热;节能;色彩  中图分类号:TK01 文献标识码:A 文章编号:1671—7597(2012)0510154—01
摘要:由于煤粉品质不迭标、给粉机机械故障一次风管及风粉混合器破损等原因,造成给粉机下粉不均匀,分析其产生原因,对提出应对措施。  关键词:给粉机;风管;窜粉;原因;措施  中图分类号:TU6 文献标识码:A 文章编号:1671—7597(2012)0510162—01
摘要:通过说明通过对工厂企业配电系统节约用电的意义,运用工厂企业配电节能的基本理论知识,从工厂的配电系统的技术改造和科学管理方面探讨实现工厂节约用电需要采取的办法,从而提出一系列的节约用电的技术措施,对大型用电的工厂和企业具有很大的指导意义。  关键词:工厂企业;配电系统;节约用电  中图分类号:F426 文献标识码:A 文章编号:1671-7597(2012)0510165-01  能源是发展国
摘要:安全在各个领域的生产过程中都是放在首位的,尤其是在与电有关的行业,责任生产,安全第一。但是就目前的情况而言,由于安全问题而引发的责任事故不在少数。为更好地对机电进行安全管理,将着重分析机电管理中存在的问题、原因以及应对的措施。  关键词:机电管理;现状;原因;措施  中图分类号:TD608 文献标识码:A 文章编号:1671—7597(2012)0510168-01  安全生产关系到每个人的
摘要:当前电磁信息泄露已经成为威胁全球信息安全的一个重要问题,因此,如何采取有效的防护举措来确保电磁信息的安全已经成为当前信息安全领域中的一个研究热点。从电磁信息泄漏的相关概念谈起,然后就当前采用的比较广泛的信息泄漏防护技术措施进行阐释,最后就如何利用计算机屏蔽技术来实现信息泄露的预防方法进行说明。  关键词:电磁信息泄露;屏蔽技术;预防  中图分类号:TP309 文献标识码:A 文章编号:167
摘要:现代化的大型机械设备在制造中必须用到的设备就是数控切割机,它在机械制造业中占有重要地位。数控系统随着控制技术的发展也越来越完善,切割机不再是人工操作,更多的是依靠微控制器(MCU)的控制,从最早的单板机到现在的PLC以及DSP,更先进的ARM控制体系。简单介绍一下数控技术以及切割机的特点和组成,并举例说明它的简单实用。  关键词:数控系统;特点;机械制造系统;软硬件组成  中图分类号:TG4