基于数据仓库实体化视图的数据一致性维护方法研究

来源 :中南大学 | 被引量 : 0次 | 上传用户:xiaoyaoju911
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
通常,数据仓库中存储了大量实体化视图,这些视图中的数据主要用于决策分析。由于数据仓库中的数据大都是从操作数据库中提取出来的,因而,数据仓库中的数据应定期刷新,以与数据源中数据保持一致。在视图维护中,算法好坏直接影响到维护的效率。 常规的视图维护算法在维护实体化视图与下层数据源之间的一致性方面暴露出一些效率问题,而且有些算法还会导致异常问题。首先,本文以斯坦福大学提出的WHIPS系统为基石,详尽的介绍了它的运行原理,分析了它的体系结构和各模块的功能。其次,本文对常用算法作了系统地介绍,阐述了每个算法的原理,指出了其优缺点,并进行了改进。最后,本文提出了一个新的算法——并行视图维护(PVM:Parallel View Maintenance)算法。 PVM算法综合了几种不同的算法,包括在线纠错算法的并发版(POLEC)、相关性更新检测算法和视图自维护方法。该算法从不同的角度或方面来处理视图维护问题,以最小的时问开销来维护视图一致性,极大地提高了维护性能。当收到更新时,PVM算法首先用相关性对其检查,对不相关更新直接抛弃;对相关更新进行并发增量视图维护或自维护机制检查;对满足自维护的更新通过查询辅助视图来避免网络传输和使实化视图与底层的数据源保持一致;对必须进行并发增量视图维护的更新由POLEC来处理,增加了对更新的吞吐能力,减少了维护的延迟。 本文主要有以下三个方面的创新: 首先,它修正OLEC算法只能顺序处理的瓶颈,赋予其并行处理能力,对并行处理所引入的问题作了深入地分析,给出了全面的解决方案; 其次,在POLEC的基础上,PVM算法结合几种不同类型算法的优点,首次在增量维护中引入自维护的思想和相关性更新处理,将这三种不同类别的算法有机融合为一体; 再次,它继承了以往所有算法的优点,但又完全克服了这些算法所表现出的缺陷,从而不论是响应时问还是消息总量,都获得了改善,从本文对算法不同方面所作的科学估算来看,PVM在维护性能上具有十分明显的提升。
其他文献
随着电子技术、通信技术和计算机技术的充分发展,科学家们开始越来越多地将电子信息技术应用到交通系统以提高交通运输的效率和安全性,并最终形成了一个专门的领域—“智能交通
生物信息学是近年来新兴的一门综合性的交叉学科。它综合利用计算机科学、信息科学和数理统计学,对大量的生物序列进行存储、检索、分析和利用。生物信息学中的一个重要研究方
本文的主要工作如下:提出基于ECC的限制性部分盲签名和离线电子现金方案,讨论基于大整数分解部分盲签名的安全性问题并提出新的基于大整数分解的部分盲签名,研究无线环境下的隐
发电企业为电网提供电能,是电力生产的首要环节。其中,运行管理是发电企业管理的核心,是保证电厂稳定运行与安全生产的关键。因此,如何有效的为企业提供运行管理的决策支持,成为电力信息化进程中一个至关重要的问题。 本文从分析国内发电企业运行管理的实际内容及业务特点入手,借鉴国外先进的管理、技术手段,使用IMS软件总线的平台和开发方法,给出了着重于运行实时监测、设备健康评价、标准化运行管理和绩效经济化
本文把在.Net平台上实现基于XML技术的报表构件的自动生成引擎作为研究目标。这个课题有如下技术难点:基于XML的数据格式RTF和RWD的定义;RTF和数据库的无缝绑定并产生RWD;报表引
随着Internet技术的发展,越来越多的应用采用XML作为信息表示和数据交换的标准,这使得通过数据库技术对XML数据进行存储、查询等操作变得日益重要,同时也为数据库研究者提出了新
实时流媒体组播服务是IP网上的一种重要应用,常见形式包括网上付费数字电视和电视会议。访问控制是普及实时流媒体服务的一个重要元素。加密传输是实现访问控制的一种方法。在
学位
近年来,随着深度学习在机器视觉领域的蓬勃发展,一些传统的视觉难题如物体识别、物体光流计算等都有了新的解决思路。然而,这些细分领域的方法往往不能独自应用于生活中的复杂场
入侵检测技术是保证网络安全的一种重要技术。在网络发展日新月异的今天,入侵检测技术仍然发挥着重要作用。然而,随着黑客攻击方法的日益多样,单纯的检测已经不能适应安全的