论文部分内容阅读
该文从XML的基本知识开始,对XML的基本概念、语法等方面,配合实例代码作了介绍,对XML解析器和文档对象模型DOM作了描述.随后,文章重点对XML数据的查询语言、索引结构、查询处理算法以及优化问题展开了详细讨论,查询语言主要介绍了Xquery[5]典型的"FOR-LET-WHERE-RETURN"的语法结构,它是XQuery所具有的最接近于SQL的语句.索引结构主要讨论了Lore系统[9]的四种索引和一个称作"Index Fabric"[1O]的索引结构,对它们基于的理论基础、框架结构、实现算法进行了描述.在对查询处理的算法中,文章首先简单介绍了传统的基于遍历树的方法[8],重点讨论了基于路径分解[6]的查询处理算法,对其编码方案、索引结构、查询表达式的分解与中间结果集合并算法进行了分析.该文的主要工作体现在第五章,一是针对在"路径分解"查询处理算法中,当查询路径很长时,需合并的中间结果集很多,计算量非常大,而合并次序不同导致计算量也不同的实际情况,基于"动态规划"的思想,设计出具体算法,先确定出中间结果集的最优合并次序,再进行合并,大大降低了合并的计算量,提高了处理效率;二是针对原算法在合并中间结果集时要进行大量树节点"祖先后代"关系的判断,该文基于关系运算设计出新的处理算法,可减少"祖先后代"关系的判断问题,进一步优化了查洵的处理.论文的主要内容组织如下:第一、二章介绍了XML基本概念、解析器和文档对象模型等内容;第三章的内容为XML数据的查询语言和索引结构;XML数据的查询处理方法在第四章进行了详细讨论;在第五章,文章提出了用动态规划算法和关系分解法对处理XML数据的查询进行优化;最后在第六章对全文内容进行了总结.