XML在关系数据库中存储方法的研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:flcyatwawa
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
XML 已经成为了互联网上数据表示和数据交换的标准格式。随着XML 数据的日益增多,各种类型的存储方法也不断涌现,比较有代表性的有XML 专用数据库存储、面向对象数据库存储、关系数据库存储等。其中,基于关系数据库技术的成熟与其应用的广泛性,把XML 数据存储到关系数据库中仍是目前乃至今后很长一段时间内的常用有效手段。鉴于XML 模式与关系模式的异构性,要把XML 数据存储到关系数据库中首先要进行模式的映射。XML 到关系的模式映射方法可以分为以下两大类。一类方法是预先制定一组固定的映射规则,根据映射规则生成与XML 文档相对应的关系模式。另一类方法则是基于查询代价优化的存储技术。由于一个XML 模式可以对应于多个关系模式,基于代价的XML 关系数据库存储技术就是在多个关系模式中搜索一个查询代价最小的模式。本文主要研究基于代价的XML 文档在关系数据库的存储问题。通过查阅大量文献,作者首先对各种XML 的存储方法作了一个简要比较,尤其是对几种基于代价的关系数据库存储方法作了具体的分析与评价,指出了各个方法的优缺点。同时,提出了一种改进方法,该方法具有如下几个主要特征:第一,引入了一种基于XML Schema 的扩展模式图,扩展模式图能更完整、更直接的表示XML 文档的结构。第二,在传统的模式转换操作中增加了’|’操作,传统的模式转换操作无法处理多选一的元素或元素组,而’|’操作正是为多选一的元素或元素组提出的。第三,在求相邻模式时,考虑了扩展模式图中的节点类型,限制模式转换时把简单类型节点单独映射为一个关系,这样大大减小了模式搜索空间,有利于搜索算法更快速的找到最优模式。第四,根据哈希连接算法的特征引入一个新的代价估算模型,引入的代价估算模型能更精确的估算对应关系模式的查询代价。第五,对作为模式空间的搜索算法的贪心算法在相邻模式的代价比较时进行了一些优化,加速了代价比较过程,提高了算法性能。最后,进行了模拟实验,获得了较好的结果。
其他文献
机会路由协议可以充分利用无线网络中无线介质的广播特质,大幅提高网络的吞吐量。同时网络编码技术能使得网络传输容量达到理论值的上限。结合网络编码技术的机会路由协议不
近年来,随着三维模型采集设备精度的提高,从现实世界获取的三维模型质量也不断提高。这些高质量的三维模型可以高度真实地保留原物体的全部细节,在文物保护、数字化图书馆、
聚类分析是发掘数据内在结构的基本工具之一,也是统计模式识别中非监督模式分类的一个重要分支。常用的聚类算法大体上可分为:基于划分的方法、基于层次的方法、基于密度的方
为了克服自然语言和程序设计语言描述规格说明产生的缺陷,人们提出了一种新的软件开发范型,其基本思想是对系统建立一个数学模型,研究和提供一种基于数学的或形式语义学的规格说
肺部听诊是诊断小儿肺炎的一种有效手段,认真准确的听诊有时会给肺部疾病的诊断带来非常有价值的信息和线索。目前,医生往往是根据临床经验进行诊断,这样由于疲劳等原因,医生诊断
随着网络技术的发展和INTERNET的普及,越来越多的信息资源放在了互联网上,广大的中小企业也都逐渐地构建起了自己的局域办公网,这一方面给用户带来了方便,提高了工作效率,另一方面
概念设计是个创新的过程,在产品设计的过程中具有重要的作用。CSCW技术和产品概念设计技术的融合,为设计师远程合作设计提供了很好的解决方案。但是目前的CSCW环境下的协同设计
商空间理论是国内学者张钹院士和张玲教授在20世纪80年代提出的,现已成为粒度计算的三大模型之一。它是用一个三元组(X,T,f)描述一个所要解决的问题,其中,x表示问题的论域;T是
近年来由于在身份鉴别、视频监控和人机交互等领域的应用前景,人脸识别获得了越来越多的关注。现有的人脸识别方法主要是侧重于解决非限定条件下一对一人脸验证问题和限定或
近年来,随着三维建模技术的发展和计算机网络的扩张,可共享和复用的三维CAD模型数量急剧增长。在现有的条件下,如何对目前已有的三维CAD模型进行有效的管理和检索,如何提高三维CA