基于Eddy的数据流自适应查询处理研究

来源 :南京航空航天大学 | 被引量 : 0次 | 上传用户:xiqing
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前无线传感器网络、网络流量监控、金融应用、通信数据管理等应用中处理的数据不再是存储在存储介质中的静态数据,而是实时、连续到达的数据流。与传统的静态数据相比,数据流具有无界、连续到达、数据动态变化等特点,所以传统的对静态数据的查询处理技术并不适用于对数据流数据的查询处理。由于对数据流的查询是长期、连续进行的,并且在查询过程中数据流的数据特性是多变的,所以数据流上的自适应查询处理是对数据流管理系统的重大挑战。目前,数据流自适应查询处理的研究中,最重要的成果是一个称为Eddy的自适应查询处理机制。它是一种基于路由的自适应查询处理技术,其核心是进行自适应路由调度的路由调度策略。但Eddy的主要不足在于:当前基于谓词独立性假设的路由策略在谓词相关的情况下,计算得到的路由可能是一个糟糕的查询计划,导致查询效率低下;当前的批处理路由调度策略的适应粒度为一个固定值K,如果K值取值不当,就会引入不必要的开销而降低查询效率。针对Eddy的这些缺陷,本文进行了研究和改进,主要工作包括以下几个方面:(1)研究了数据流的自适应查询处理方法,指出Eddy自适应查询处理机制中的不足;(2)针对Eddy当前基于谓词独立性假设的路由策略不能很好地处理查询谓词相关情况的数据流查询处理,提出了一种面向谓词相关的路由调度策略——自适应贪婪路由策略。该策略把谓词之间的相关性纳入考虑范围,在谓词相关的情况下,计算得到的路由更加接近实际的最佳路由。相关实验表明在谓词相关的情况下,本文设计的路由策略是有效的;(3)Eddy中的批处理路由策略的适应粒度为一个固定值K,如果K取值不当,会导致Eddy重复计算同一路由,从而产生不必要的开销并降低查询效率。本文对批处理路由策略进行了改进,使其能够获取数据流数据特性的变化,并自适应地调整适应粒度,确保无论数据流数据特性如何变化,都能获得较好的查询效率。相关实验结果和分析表明,这一改进策略是有效的。
其他文献
目前,从大量数据图像中精准的检索到特定的图像是多年来图像处理领域的研究热点。由于成本,时耗和主观性等问题,导致传统的基于文本的图像检索技术(TBIR)在面对海量的图片数据库资源时检索效果并不突出。相比之下,基于内容的图像检索技术(CBIR)能够更好的适应这种情况,在面对种类繁杂的图像数据库资源时检索效果比较好。CBIR对基于文本的检索技术在图像检索方面所存在的缺陷进行了改进,在图像检索时根据图像的
学位
商标库是存储商标图像的大型数据库。商标局建立并且管理商标库的过程就是要将需要注册的商标作为样本检索商标库,检查该商标是否与已经注册过的商标过于相似,以决定其是否可以
随着数字信息技术和网络技术的高速发展,计算机的发展进入了后“PC”时代,嵌入式数据库和嵌入式操作系统作为嵌入式系统最重要的两部分,成为国内外学者的研究热点。然而由于嵌入
基于IEEE 802.11的长距离无线mesh网络具有带宽高、成本低、覆盖广、易于部署和安装等优点,适合于发展中国家或地区偏远乡村的Internet接入,提供远程医疗、远程教育、电子政
随着信息技术的飞速发展,互联网技术在人们的生活中发挥着越来越重要的作用,利用互联网技术整合企业的相关资源,既方便管理,又节省了人力物力资源,而将这些不同的平台之间的资源整
由于广泛应用于图像处理、模式识别、人工智能、机器人等领域,耦合神经网络已成为理论研究和工程领域中重要的研究课题。在现有的关于耦合神经网络的文献中,很少考虑反应扩散
随着移动信息服务业的快速发展,二维码技术在工业自动化、商品流通、移动电子商务等众多领域内得到广泛应用。但在复杂的情况下,受相机抖动、光线剧烈变化、成像系统紊乱等因素
随着经济社会的发展,公司、企业的分工越来越细化,部门之间的联系也越来越多,进行人事管理时,传统的手工管理方式就会出现许多弊端,增加了企业管理的复杂度,大大降低了管理效
无线传感器网络(Wireless Sensor Networks,WSNs)是指由一些具有感知能力、计算能力和通信能力的传感器节点通过自组织形式构成的网络。由于WSNs具有部署快速、成本低,并且节
膜生物反应器(Membrane Bioreactor,简称MBR),是将膜分离技术与生物技术相结合的一项技术,并被广泛应用到污水处理领域中。作为当今污水处理的新工艺,它具有结构紧凑、管理方便、