基于XML的数据流查询算法研究

来源 :安徽大学 | 被引量 : 0次 | 上传用户:xulxulo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着XML数据被越来越广泛地使用,人们对XML数据查询提出了越来越高的要求。前期的研究主要集中在XPath的查询处理上。XPath相对比较简单,但表达能力有限,比如不能表示连接操作等。作为W3C的推荐标准,XQuery的表达能力比XPath强大很多,同时XQuery也比XPath复杂很多。XQuery兼有结构化查询语言和过程化查询语言的特点。一方面,XQuery的FLWR子句在一定程度上类似于SQL的select-from-where子句是XQuery的最重要的表达式;另一方面XQuery支持表达式的嵌套,支持诸如条件表达式(IF-THEN-ELSE),循环表达式(FOR),返回值(RETURN)等,还有变量和谓词的作用域问题,这些都是一种编程语言的重要特征。因此关于如何有效地进行XQuery查询,目前是一个研究热点。  然而,XQuery查询技术虽然在处理传统的XML数据功能强大,然而它没有充分考虑数据流的问题,即待处理的数据连续不断的到达XQuery处理机。这些数据可能来自于数据采集设备或者是一个运行很长时间的计算仿真。这些XML数据流的长度远远超过了当前计算机的存储容量。从而使得不可能对这些数据进行存储(诸如排序等加工操作),以便在处理这些数据时运算更加简便。然而在特定情况下,要求对数据流进行一遍遍历或计算之后,就能得到正确的答案。  本文首先介绍了XML查询的相关概念、内容、特点和作用。阐述了XML的相关技术,分析XQuery查询技术,详细说明了XQuery查询技术的优缺点。然后在目前研究的基础上分析和总结了一种XQuery查询的数据模型,并提出了一种如何在数据流上有效的执行XQuery查询的查询机制。关于这种查询机制,本文将从三个方面来进行:(1)利用一些优化方法(如流数据流程图、水平合并和垂直合并技术等)来对XML数据流,XQuery查询进行转换和优化;(2)提出了一种判定方法来决定那些情况下的XML数据流能被一遍遍历处理,那些情况下不能进行一遍遍历处理,以及经过一遍遍历能否能得到正确的结果;(3)在以上的工作的基础上利用改进的XQuery查询算法对数据流进行一遍查询。  在文章的最后,针对文中提出的XQuery查询机制存在的一些问题(比如在一些特定的情况下不能对数据流进行一遍遍历查询等),提出今后进一步的工作。  
其他文献
随着Internet上Web服务数量的日益增多,如何从众多的服务中准确地找到符合要求的服务成为服务发现的难点和关键。基于UDDI(Universal Description,Discovery and Integration,
XML作为一种标记语言,具有有效的表达各种信息、数据和使各种应用协同工作能力,有望成为下一代互联网信息交换的标准。XML数据的存储、查询和绑定的理论和技术是当前XML的研
文本分类是机器学习与信息挖掘中的一个传统问题。不同于类别较少且均处在同一层面的传统分类任务,本文所谓“层次型分类”是指类别间存在一个树状的层次结构;并且本文所谓“大
随着Internet中各种技术的迅速发展,网络应用不再局限于文件传输、电子邮件等传统应用,一些新型的移动业务正在不断地出现,因此下一代互联网NGI(Next Generation Internet)应
近几年来,互联网技术蓬勃发展,信息爆炸使得人们对于信息和资源的检索提出了更高的要求。随着网络技术的不断发展,信息检索的各项技术以及搜索引擎的性能都得到了很大的提升。 
随着Web2.0的出现和发展,越来越多的人开始在网上表达他们对一些产品和服务的意见。用户的意见通常包括对该产品的整体评分以及一些文本评论。这些信息对于生产者和消费者来
网格计算和Web服务技术的结合使得网格环境成为了一个面向服务的计算环境。服务资源的动态性、计算环境的异构性等因素的存在要求网格程序的开发者拥有一个良好的编程模型。
本文以北京市出租车决策支持系统为背景,利用数据仓库及OLAP多维分析等相关技术,对出租车营运数据这个主题进行了比较全面、深入地分析与研究,设计实现了一套以营运数据为主
分布式协作开发环境的建立是实现工具之间交互与数据共享、提高设计与开发效率的重要手段,其中所集成的系统设计工具既有商业软件,也有自主研发的软件。本文涉及的研究课题采
随着互联网以及网上交易的普及,人们对交易安全性和匿名性的需求逐渐上升。这种需求对于希望在网上交易新闻线索、举报证据等敏感信息的用户更为迫切。敏感信息的交易者经常