XML查询缓存中替换策略的研究与设计

来源 :山东大学 | 被引量 : 0次 | 上传用户:tdj000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
XML(eXtensible Markup Language,可扩展标记语言)自发布之日起就以其良好的可扩展性受到业界的普遍欢迎和支持,越来越多的应用领域已经将其作为主要的存储格式和传输媒体。随着XML应用规模和复杂性的飞速增长,快速有效地处理XML查询成为当前研究的热点。随着对XML查询优化问题的不断深入研究,针对XML查询的缓存技术受到越来越多的关注。通过对“热”数据(频繁查询模式)进行缓存,可以有效地提高数据库的处理效率和响应能力。由于缓存空间是有限的资源,在保持缓存性能的同时,需设计出适当的替换策略来决定哪些频繁查询模式最适合驻留在缓存中,因此缓存中的替换策略又是XML查询缓存中需要着重解决的问题。本文将基于XML查询的语义缓存机制作为改进XML查询系统的有效手段。在对现阶段XML文档查询系统研究和分析的基础上,本文设计了一个引入语义缓存机制的XML文档查询系统。在讨论了该系统各主体模块的功能后,本文着重就XML查询缓存的替换策略展开了深入的研究,并提出了一个有效的方法。该方法按如下三个阶段进行实施:首先使用数据挖掘中聚类的方法基于语义将XML查询进行聚类,使具有相似信息的查询被分到同一组中。分析频繁有根子树的挖掘算法并使用算法FastXMiner从XML查询中发现频繁有根子树,在此基础上提出了一个新颖的方法基于语义聚类XML查询。其次,对正关联规则和负关联规则的概念进行介绍和研究分析。FastXMiner从用户查询中挖掘出了频繁的XML查询模式,一旦缓存已满,不频繁查询模式的查询区域将首先被回收。然而FastXMiner中的基于频繁查询模式的技术忽视了用户查询的临时特性。本文在对XML查询聚类的基础上,提出了一个从XML缓存的用户查询中挖掘关联规则的有效算法。为了发现关联规则,着重强调了用户查询间的临时序列关系,因此与只强调频繁性或最近性的方法相比,能更可靠地预测接下来可能的用户查询和规则的置信度。该算法执行后,正关联规则和负关联规则可以被同时挖掘出来。最后,对现有的缓存替换策略进行了分析和研究,根据前面挖掘出的关联规则的知识设计出一个合适的XML查询缓存替换策略。本文进行了实验测试,分别对查询聚类和XML查询缓存替换策略给出了实验结果与性能分析,实验结果显示与其它算法相比,本文的方法更显著地提高了缓存性能。
其他文献
在云计算数据中心中,虚拟磁盘镜像作为保存虚拟机运行环境的容器,其访问效率将影响整个系统的性能。为了缓解虚拟机管理的瓶颈问题,一些协作式的虚拟磁盘镜像存储系统和方案
随着Internet的飞速发展和普及,P2P技术成为计算机网络技术中的一个热点。与传统的C/S模式相比,P2P具有无可比拟的去中心化、可扩展性、健壮性、高性价比、负载均衡等优势。它使
学位
随着计算机产业的加速发展,我们逐渐步入了一个新的互联网纪元,传统意义上的电视也迎来了新的变革。从视觉效果、功能多样性等方面而言,以往电视都无法和现今的相提并论。自
随着计算机网络规模不断扩大,计算机网络用户的多样化,使得网络出现各种异常的可能性增大,DDoS攻击、蠕虫病毒等异常流量对网络性能影响越来越大,网络安全问题日益突出.现在
随着Internet的发展和新技术的不断出现,对中间网络交换设备的要求越来越高,网络交换设备不仅要具有高速性还要具有高度的灵活性,因此诞生了专门处理网络事务的处理器——网络处
近段时间以来,愈来愈多的项目都提出了使用消息传递策略来解决异类主机通信的问题,以及近年来消息中间件在实际工程中需求的大面积增长,使得消息中间件的开发受到业界和学术界的
Web服务作为目前最新颖的分布式计算模型,有力的整合了Internet上的各种资源。服务组合是指将多个成分服务按照其功能、语义以及它们之间的逻辑关系组装提供聚合功能的新服务
随着网络技术的发展,越来越多的用户希望能够访问和处理来自分布于不同的数据源的信息,实现数据在多个系统与不同数据源之间的集成与共享。在现有的分布式异构的环境中,将信
电信网络中特别是管线网络(包括光缆、主干电缆、配线电缆等),其设备与地理环境紧密地联系在一起,电信线路的建设、维护都离不开详细而完整的GIS系统。通信网络资源管理系统本
新型干法水泥窑在水泥工业中得到了越来越广泛的应用,在干法窑的生产中,如何实现从配料、烧成、到监控报警全程实现电脑监控是一个难题。人工进行这些操作,首先长期增加了人力成