XML结构连接算法的研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:hezefgj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Internet的迅速发展,网站和静态HTML页面也急剧膨胀。随着Web应用的日益广泛,它的局限性越来越明显,已经不再适应下一代更复杂的Web应用。因此,在未来的Web发展中,如何提高信息检索的准确性和效率成为关键问题。可扩展标记语言XML的出现改变了Web的基本面貌。XML将成为Web信息发布和交换的事实上的标准。对XML的深入研究将有力促进企业的信息化和电子商务的发展,具有巨大的应用前景和经济效益。在这种情形下,XML数据库蓬勃发展起来。对XML文档存储、索引、查询的研究逐渐成为研究热点,广大的研究者围绕着这些问题进行了大量的研究。其中对XML文档查询研究的核心问题是对XML结点集合结构连接算法的研究。 XML结构连接算法首先是在XML结点编码的基础上提出的。广大的研究者已经提出了各种结点编码方式及其对应的结构连接算法。著名的如区间编码以及对应的Anc_Desc_B+算法和PBiTree编码以及对应的算法。但Anc_Desc_B+算法不能处理无序无索引结点集的结构连接,而VPJ算法不能处理有序有索引结点集的结构连接,并且不存在基于区间编码的算法能有效处理无序无索引结点集的结构连接,也不存在基于PBiTree编码的算法能有效处理有序有索引结点集的结构连接。 本文提出一种新型的结点编码结构EXN-Tree编码。本文首先提出了EXN-Tree的概念,将XML文档树的结点映射到EXN-Tree,依据EXN-Tree的结点编码生成XML文档树结点数据结构。该结点数据结构隐含文档树的结构信息,任意两结点间依据结点的数据结构信息就可以快速确定两者之间的关系。与以往编码结构相比,该编码结构能最快的确定XML文档树种任意两个结点对之间的结构关系。 在EXN-Tree结点编码的基础上,本文提出了适应于有序有索引结点集Stack_EXN_Desc算法以及适用于无序无索引结点集的EVPJ算法。并且StackEXN_Desc算法只需要扫描一遍后裔结点结合即可,不需要扫描祖先结点集,与以往算法相比,对磁盘扫描次数大幅度减少,具有更优的磁盘I/O复杂度。EVPJ算法由已有的VPJ算法修改得来,与原算法相比,它有更好得CPU性能。
其他文献
随着放射治疗相关技术的发展,病人的医学影像数据规模越来越大,放射治疗计划系统需要处理的数据量也随之大大升高。临床应用中,医生往往需要等待放射治疗计划系统计算完成,而等待
报表系统是数据库应用系统中最基本、最重要的子系统。采用手工方式开发嵌入式报表系统存在开发任务繁重、产品生命周期短等缺陷。因此,研究报表自动生成具有重要意义,其目的在
完全的句法分析是当前自然语言处理的一个重点和难点。现阶段被认为无法彻底解决。进行部分句法分析,即组块分析,既可以达到自然语言句子进行句法分析的目的,又可以降低分析
中间件技术和操作系统技术,数据库技术并列为三大系统级软件技术之一,IBM、BEA、Oracle等国外著名厂商围绕J2EE应用服务器的中间件技术竞争也激烈地展开。但是J2EE技术在解决
光电经纬仪的通信系统中,视频信号的传输数据量是最大的。一直以来视频信号的传输都是通过并行电缆进行传输,一方面系统的安装和维护十分复杂;另一方面,又容易受到其他系统的
电子政务是随着计算机技术和网络技术的快速发展而建立起来的。电子政务的目的是利用现代的信息技术实现政府办公网络化、自动化、无纸化,打破政府各部门之间的隔阂,提高政府
三维重建是一个跨学科的热点研究领域,其目的是利用已知数据恢复物体的三维立体信息,并在计算机中进行显示。在文化遗产数字化保护领域,利用三维重建技术,可以更好的重现文物
计算机取证是打击计算机犯罪的有力工具及手段。传统的计算机取证大多采用事后分析的静态取证技术,该取证技术存在的问题是,证据的采集不够及时、全面,经恢复的数据可能是已经被
网格发展的目标是一个以共享资源为目的的基础设施。这里的资源是广义的,可以是计算资源、存储资源、信息资源、通信线路、程序和科学仪器,即一切能够通过通信网络连接起来的资
“3S”技术是GIS、GPS和RS技术的总称。作为目前对地观测系统中空间信息获取、存贮、管理、更新、分析和应用的3大支撑技术,它们是现代社会持续发展、资源合理规划利用、城乡规划与管理、自然灾害动态监测与防治等的重要技术手段,三者在空间信息管理上各具特色,均可独立完成自身具有的功能,同时相互之间又有许多关联,在解决问题的功能上各有优点与不足。三者的结合与集成已成为空间科学的发展方向和必然趋势。本文基