【摘 要】
:
由于数据流具有实时性、连续性、无界性的特点,传统的数据库管理技术已不能适应对它的处理需求,数据流查询成为数据库理论研究的一个新领域。其中连接查询由于其应用广泛性和
论文部分内容阅读
由于数据流具有实时性、连续性、无界性的特点,传统的数据库管理技术已不能适应对它的处理需求,数据流查询成为数据库理论研究的一个新领域。其中连接查询由于其应用广泛性和复杂性而得到更多的关注,但大多数的研究成果主要是针对二路连接查询,多连接查询作为数据流连接查询的一个重要方面,目前研究的还相对较少。本文首先分析了数据流滑动窗口二路连接查询,包括算法的执行过程及连接代价模型,介绍了目前主要的两种数据流多连接查询方式:多连接算子和连接树。然后,本文在滑动窗口二路连接代价模型的基础上,给出了多连接算子中数据流连接过程的代价模型,针对树型查询提出了最优探测序列判定算法DSTQPS-OPT(Data Stream Tree Query Optimal Probe Sequence),并针对非树型查询提出了最优探测序列判定算法DSGQPS-OPT(Data Stream General Query Optimal Probe Sequence)。接着,本文对基于线性连接树的多连接查询计划的中间状态进行了分析,并提出了最小中间状态线性连接树生成算法DSLJT-MinIS(Data Stream Linear Join Tree–Minimal Intermediate State)。最后,本文通过实验验证了多连接算子中的数据流连接代价模型的正确性,并通过对比实验证明DSTQPS-OPT算法优于已有的贪婪算法。
其他文献
随着Internet的快速发展与日益普及,信息安全越来越受到人们的关注。虽然人们在主机上安装防火墙、入侵检测系统预防网络入侵,但入侵者仍可能通过非法手段盗取或篡改机密信息
随着Internet的不断发展和网络用户的大量增加,各种多媒体业务得到大量应用,而且越来越多的新兴业务如视频点播、电视电话会议、远程教学等不断涌现,导致传统的点对点单播通
移动Ad Hoc网络是一种新型的无线网络,正在得到越来越广泛的应用,成为移动通信技术发展的一个重要方向。Ad Hoc网络使用无线链路,具有安全性差、网络拓扑动态变化等特性。与
在我国,多数电视台从90年代后期开始使用商业性调查机构提供的收视率数据。收视率是衡量电视节目质量的重要指标,收视率统计数据已经成为电视台评价自己的节目,确定各频道和时段
关联规则可视化知识发现是一种利用可视化技术从数据中识别有效的、新颖的、潜在的、有用的、可理解的关系模式的非平凡过程。由于人类的大脑具有很强的模式识别能力,因此将
软件危机的出现使得人们开始寻找工程化的方法,因此出现了软件工程;同样,如何处理需求到设计的过渡和应对需求变化推动了软件体系结构的提出和发展。 但是基于需求驱动的软件
蛋白质远距同源检测是生物信息学中的一个重要问题。近年来,出现了很多新的同源检测方法,并取得了一定的成功。但是对于远距同源检测,这些方法的效率并不高。本文以此为出发
数据挖掘(Data Mining),指从大型数据库或数据仓库中提取隐含的、未知的、非平凡并有潜在应用价值的信息或模式的过程,它融合了统计学、数据库、人工智能、机器学习等多个领
地理信息系统(Geographical Information System,简称GIS)是20世纪60年代开始迅速发展起来的管理分析新技术,是计算机科学、地理学、测量学、地图学、管理学多种学科交叉的产
对等网络以其大规模,自组织,以及健壮性等优特近年来受到学术界越来越多的关注。自第一代对等网络系统Napster开始,文件共享一直是对等网络的一个非常重要的应用。由于对等网