论文部分内容阅读
随着Internet技术的迅速发展,各种信息的种类和数量也不断增加,越来越多的应用需要访问各种异构数据源。但是许多企业、单位、机构原有的应用系统往往采用不同的开发平台、操作系统和异构的数据库,并且异地分布,这种异构、分布的特点阻碍了对各种数据资源的共享和交换。
要实现对异构数据的共享和交换,必须先解决异构数据源的转换问题。目前,存在几种主要的转换方式,像使用软件工具、利用中间数据库等。这些转换方式主要是针对关系数据库,没有考虑其他的异构数据源,而且具体的转换工具往往受到开发平台的限制,不具有通用性。采用基于XML的数据转换方式,将XML作为异构数据源的统一数据格式,屏蔽开发平台、系统环境、数据库等方面的异构性,可以更好地解决对异构、分布数据的共享和交换的问题。
XML作为一种可扩展性标记语言具有自描述性、可扩展性、高度结构化、便于网络传输的特点,非常适合于Web上的数据交换与信息发布。与此同时,SUN公司的J2EE是目前广泛推崇的基于多层体系结构的强大商务系统架构并且提供对XML的全面支持。利用JAVA技术,在J2EE的架构上实现对XML文件的数据处理,具有重要的现实意义。
本文首先详细介绍了异构数据源的特点、分类及其转换方式,然后分别从异构数据库、非XML格式的文件到XML文档的转换,XML文档的存储和管理,基于XML的信息发布等几个方面对异构信息的转换和发布进行了探讨。在此基础上结合J2EE多层体系结构和XML技术,采用数据处理过程中的功能模块和组件化思想,给出了系统的设计框架结构和异构信息的处理过程。最后,以企业电子商务系统中产品信息的转换和发布为例,说明了基于XML的异构信息处理系统的具体实现过程。系统主要实现了异构信息的转换和基于XML的信息发布两个部分。异构信息的转换包括:关系数据库信息到XML文档的转换;XML文档到关系数据库信息的转换;非XML格式的文本文件到XML文档的转换。基于XML的信息发布主要是结合XSL对信息进行多种形式的发布。在关系数据库信息到XML文档的转换中,利用JDOM建立和输出XML文档,比DOM更简单、更直观、更容易使用。在XML文档到关系数据库信息的转换中,利用StAX对XML文档进行解析,StAX提供了一个拉式解析器,让客户端应用程序完全控制解析过程,可以更高效的解析XML文档,避免了使用DOM、SAX存在的缺陷和不足。
本文所开发的系统具有扩充性、平台无关性和可靠性的特点,是一个通用的Web应用系统。