基于双路索引的XML查询优化研究

来源 :北京化工大学 | 被引量 : 1次 | 上传用户:cdtst
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
XML是一种可扩展的标记语言,由于其丰富的表达能力和自描述性、灵活性等特点,被广泛应用于Web环境下数据的表示和共享。随着大量数据以XML格式保存,如何高效、系统、科学地管理XML文档已成为数据库研究领域中的一个重要挑战。本文首先研究了从XML模式到关系模式之间的映射,然后给出了一个基于Schema的XML存储模型,在这个存储模型基础上研究了XML查询语言和索引查询技术;结合多种索引方法,提出了双路索引模型,最后是它的查询处理算法,大体上包含以下内容:(1)由于采用传统的模型来存储XML文档虽然模型简单,但是它仅适合于传统的以从上到下或从下到上顺序遍历XML文档,查询效率较低,本文在改进的基础上提出了一个基于Schema的XML存储优化模型。利用在实际应用中经常存在的XML数据的模式信息-XML Schema,根据相应的转换规则,生成基于关系数据库的存储模型。与传统方法相比,其优点在于:将传统的大表集中存储分散成相互关联的小表存储,适合从任意层次遍历XML文档。当文档比较大、节点数比较多时,利用该存储模型进行查询,程序不必一层一层逐个节点遍历文档,提高了查询效率。此外,它还为索引的建立提供一个相对持久和稳定的参考。(2)在基于Schema的XML存储模型上,提出了一种新的XML文件索引方法-DI索引。目前的路径索引多倾向于解决绝对路径表达式的查询,而对于相对路径表达式的处理,得到满足路径表达式的结果可能需要遍历整个索引,付出较高的查询代价。DI索引方法采用倒排文件索引机制及中文分词技术,建立了绝对索引模型和相对索引模型,能有效支持各种形式的路径表达式,又不会占用过大的空间。绝对索引模型将查询路径表达式缩短,减少了比较次数,相对索引模型建立父子索引表补全路径,用较小的索引结构替代原始查询。利用这种索引方法克服了元素查找总是从树的根部开始进行的缺陷,节约了索引存储空间,提高了查询速度。(3)基于DI索引,本文还研究给出了相关查询处理的算法。采用Fabric索引和DI索引,对3种不同的查询语句进行了测试,给出了模型仿真试验结果。实验结果表明,该方法可以有效地提高查询处理的性能。
其他文献
伴随着我国经济的高速发展,我国电网技术的发展也十分迅猛,各种新型设备被引入电网,大区电网的互联也变成现实,在人们享受电网技术进步的同时,电网的潜在威胁也在变大。提高大电网安全稳定的运行水平已成为电网建设的基础性问题。母线负荷预测是动态状态估计、安全稳定分析、无功优化、厂站局部控制等的基础,是提高大电网安全稳定运行水平的一大工具。母线负荷预测的方法主要分为两大类:一类是基于系统负荷预测的预测方法,一
学位
本文主要工作是对椭圆曲线标量乘算法的研究,椭圆曲线标量乘算法是指一个大整数k乘以椭圆曲线上的一个点P,其研究点主要有两个,一个是算法效率,另一个是算法安全性。在效率方面,主
入侵检测是一种主动的网络安全防御措施,它不仅可以通过监测网络实现对内部攻击、外部攻击和误操作的实时保护,有效弥补防火墙的不足。而且还能够结合其他网络安全产品,对网
k跳可达性查询是图可达性查询问题的一般形式,在社交网络和传感器网络领域有很重要的应用。随着图数据的规模不断扩大,大图中的可达性查询问题受到了越来越多的关注。传统的
随着科学技术的不断进步,地质勘测的方法和手段也在不断推陈出新,其中采用钻井后数字摄像技术获取具有真实感的全孔壁图像进行地质分析已成为地质勘测的重要方法之一。目前,
随着教育信息化进程不断推进,智能教育系统积累教与学数据呈现出加速增长的趋势。如何将数据分析挖掘技术应用于教育领域,从教育数据中挖掘有价值的信息,从而揭示教育的自然
虚拟现实集成了计算机图形技术、计算机仿真技术、人工智能、传感技术、显示技术、网络并行处理等技术,是一种由计算机生成的高技术模拟系统。早在20世纪70年代它便被用于宇
对铝电解槽进行优化控制的主要目的,是提高电流效率,降低电能消耗。计算机智能控制能够出色的完成这一任务。然而,铝电解工业过程的工艺指标(如电流效率、直流电耗等)往往难
随着互联网的发展,web资源呈现出高速增长,但目前互联网中的信息处理自动化低,信息之间关联性差,即使借助功能强大的搜索引擎,由于冗余信息过多,也无法快速准确地从web资源中