数据集成中基于XML的查询重写研究与实现

来源 :重庆大学 | 被引量 : 0次 | 上传用户:jht20007
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的发展,许多应用开发中会遇到数据分布在不同的地点的情况,而且这些数据存在着异构性,因此开发应用需要对这些分布式的异构数据进行有效集成。同时由于在这些数据的基础上已经开发了各种应用系统,所以在对数据进行集成时要求不能影响已有的系统。数据集成的目的是实现对分布式异构数据的有效集成和透明访问,而不改变原有的数据。数据集成中数据提供者希望能方便地将数据发布出去供集成,并要求保证自身数据源的安全性,数据使用者希望通过数据集成能透明访问需要的数据,而不必了解太多的细节。由于XML的可扩展性、结构性以及平台无关性的优点,XML迅速成为Internet上数据交换的标准。基于XML的数据集成不仅成为现在研究的热点,也成为数据集成的一个理想的解决方案。在数据集成领域,将查询重写成数据源模式上的子查询是数据集成系统中非常关键的一步。针对数据集成系统中要解决的关键问题,本文所做主要工作如下:(1)研究了基于XML的数据集成问题。首先介绍了XML及相关技术、查询重写算法,数据集成系统结构。其次综合研究了数据集成的一些基本知识。如:集成系统理论知识,基本映射方案,查询处理。(2)针对查询重写过程中的模式转换问题,提出了一种全局模式与源模式的转换算法。以XML为基础,通过定义查询语言和映射语言,模式匹配分解,生成映射规则集合,用映射规则替换全局查询最终生成子查询。子查询通过包装器转换为针对具体数据库的原查询。(3)针对传统的数据集成系统已经远远不能适应人们获取数据的需求,它们在动态的添加或删除数据源方面、支持异构数据源方面及根据用户的需要发布服务方面存在不足。提出了一种以XML为数据交换格式,使用XMLSchema建立公共模型,Mediator集成模式的异构数据集成中间件HDAIM设计和实现方案,通过在分布式环境下建立一个公共的集成环境,屏蔽了各个异构数据源的平台、系统环境、内部数据结构等方面的异构性,对它们进行无缝连接,为用户提供一个统一和透明的访问接口,实现了对异构数据源间关联数据的访问和发布。通过一个学生信息查询系统的实验模式对本文的算法和集成系统进行了验证,验证了可行性和正确性。最后提出了今后进一步研究和改进的内容。
其他文献
语义Web的目标是使得Web上的信息具有计算机可以理解的语义,语义原生XML数据库系统(简称SNAX)的目的在于构建一个提供研究语义Web的各种理论、技术和方法的平台。其中的本体
水泥基压电传感器是济南大学山东省水泥工程技术研究中心开发研制的,该传感器与传统压电传感器相比具备很多优点。水泥基压电传感器与混凝土材料具有良好的相容性,这样就大大提
随着网络业务的不断发展,Internet上出现了大量的网络数据中心。这些数据中心为不同的公司、企事业单位提供服务器业务托管和网络接入等各种服务。一些网络信息公司其至拥有自
近年来,复杂网络系统已经融入到人们生产生活的方方面面。作为一个新兴且活跃的科学研究领域,复杂网络早已引入到在现实世界网络的实证研究。目前,在计算机科学、社会科学、
局部保持的典型相关分析(LPCCA)是一种能够解决大量非线性问题的新型算法。它通过局部线性的方法达到解决非线性问题的目的,不但能保持各样本集的局部结构信息,而且能够得到
互联网的高速发展给人们的生活带来了许许多多的便利,但是同时也为网络犯罪分子提供了更多途径,所以引导青少年健康上网,依法严厉打击淫秽色情信息传播成为了互联网工作不可
随着信息技术的不断发展,不断产生的具有分布、异构、海量等特征的数据源对存储资源、计算资源和网络资源等提出了极高的性能需求,也为以往的数据资源管理技术带来了巨大的挑战
学位
桥梁是投资巨大,使用期长的大型基础设施,因此它的安全性对国民经济有着举足轻重的影响。我国现有大小公路桥5000余座,在运营过程中,由于荷载、疲劳、腐蚀和材料老化等不利因素的
问答系统是信息检索分支,属于精确检索。问答技术是自然语言处理领域中一个非常热门的研究方向,它综合运用了各种自然语言处理技术,是国内外信息技术的研究热点。目前,国内外
电视的数字化给我们带来了很多新的服务。数字电视条件接收系统能够提供有效的系统管理和用户控制,是数字电视运营商开展付费电视及各种增值业务的关键技术。随着高清的开播,