论文部分内容阅读
在充分吸收国内外数据集成领域研究成果的基础上,通过分析分布式对象技术、Agent技术和XML技术,提出了一个以多数据库系统为主要技术路线,基于XML和CORBA的Web数据集成系统框架.该系统框架采用CORBA作为对象模型,XML作为数据模型,用XML查询语言对Web上异构多数据源中的数据进行集成,即将Web作为一个巨大的数据库,采用数据库方法对Web数据进行集成管理.由于采用CORBA来处理平台层的异构性和实现的透明性,采用XML作为公共数据模型实现数据的统一表示,因此具有很好的灵活性和优越性.Web数据集成技术包括CORBA与Web集成技术、公共数据模型(CDM)和元数据字典(MDD)、模式集成和转换以及全局集成视图的设计.研究了目前相关的Web技术、Web对象技术以及CORBA与Web的集成方式,在此基础上提出了数据库在CORBA和Web环境下的连接方式和利用Java构造Web上CORBA应用的方法.定义了XML数据模型,给出了局部数据模型到XML数据模型的转换算法.使用XML Schema对元数据字典(MDD)模型进行设计,并通过MDD管理程序对数据源的元数据进行管理.分析了模式集成的概念、模式集成的目标以及模式集成需要解决的问题,提出了在Web数据集成系统中通过设计Wrapper/Agent来解决模式集成中语义和结构异构性的方法.研究了Web服务技术的相关内容,分析了在集成系统中对采用Web服务的考虑.Web服务为企业的系统集成提供了新的框架,比传统的分布式计算技术(如COM/DCOM,CORBA和EJB)在简单性、开放性、灵活性、动态性和高效性等方面具有明显的优势,为进一步的研究指出了方向,但是企业是否采用Web服务技术也要慎重考虑.描述了自行开发的一个扩展多数据库原型系统Panorama的功能和实现.该系统采用基于CORBA的分层体系结构,由全局代理和局部代理协同完成具体业务流程,采用XML数据模型对全局模式进行定义、存储和管理,具有模式集成、查询处理和事务处理等功能,能对Oracle、Sybase和DM2等成员数据库提供透明互操作.