论文部分内容阅读
当前的应用系统环境中,数据异构是一个很突出的现象。XML作为一种数据格式描述的元语言标准,不断地被应用到各种领域的数据集成中去。普通高校招生数据是学校管理的基础数据,但由于招生数据具有分布性和异构性的特点,院校对招生数据缺乏统一的管理,必须将招生数据集成。
基于XML中间件的异构数据源集成系统通过构建全局模式,提供访问异构数据源的统一接口,系统主要由中介器、包装器及XDBC接口组成。在系统结构中,用XML来描述关系数据,利用XMLSchema来描述输出模式以及集成后的全局模式,通过定义数据源XMLSchema的元素或属性与全局XMLSchema的元素或属性之间的映射,并设定不同数据源XMLSchema之间的连接条件,创建全局XMLSchema,对模式冲突,提出了冲突消除策略。
基于XML的数据集成系统的查询处理主要包括全局查询和局部查询,查询处理用XQuery描述。XQuery被送往全局代理后,首先对XQuery进行校验,然后对XQuery进行标准化,标准化后的XQuery被分解成多个XQuery子查询送到局部查询代理,最后由XML结果组合器负责组合来自局部代理的中间XML结果。局部查询采用XQGM图作为XQuery的代数描述模型,将全局查询代理分解的XQuery翻译成关系数据源上的SQL查询,然后将查询提交给关系引擎执行,最后将关系结果结构化并置标成中间XML结果。
工作的意义在于解决了关系数据库的XML化问题,设计的平台框架提供统一查询异构数据源的服务,为在高校招生数据集成领域内部建立一个通用数据访问底层架构奠定了基础。