基于XML数据仓库历史数据归档与管理策略的研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:xiamen88
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据仓库系统中大量的细节级数据是联机分析处理和数据挖掘应用程序的基础和重要操作对象,为了保证当前的联机分析处理和数据挖掘应用程序的效率和质量,过期的大量的细节级数据必须归档为历史数据。本文通过对现有的基于XML的以文件为单位的数据仓库历史数据归档与重构策略的研究,发现现有的归档策略有很多不完善的地方。本文主要通过改变归档单位、文档结构以及归档文件与XML文档之间的对应关系等途径来解决原策略中所出现的问题。改变文档结构使XML文档中可以不增加各版本中相同信息的保存空间,而只增加各版本中变化信息和标志信息的保存空间。同时将原策略中不同版本的文件对应不同的XML文档,变为同一文件的所有不同版本在执行归档操作后都只对应一个XML文档。这样就可以避免不同时间的归档所形成的不同版本的数据文档,由于数据变化量不大而造成一定程度的空间浪费,并消除了各归档之间存在的数据重叠现象,从而有效的提高了存储空间的利用率和系统的检索性能。本文通过相应的实验数据有力地证明了改进的归档策略在节省存储空间上显著的优于原有策略。为了更好的对归档数据进行有效的检索提高存储设备空间利用率,本文提出对归档的历史数据实现以记录为单位的分级管理策略,即根据归档历史数据的再使用情况将使用频率低的历史数据迁移到更低级的存储设备上。
其他文献
分布式系统可以被视为一个连接许多代理的网络。在传统的分布式系统中,代理们被假定为是服从性的,即他们遵循一定的算法。当许多计算机联结成为一个分布式系统时,系统的各个
随着学校网络服务器数量的增加,服务器管理成为网络管理发展中一个很重要的方面,对网络的运用和发展有着很大的影响,并已成为现代信息网络中最重要的研究问题之一。本论文以扬州
纤维成分自动识别是涉及图像处理、模式识别、计算机视觉及神经网络等多个领域的研究课题。鉴于传统纤维检测方法存在诸多弊端以及计算机图像处理技术的不断发展,纤维自动识
随着计算机和Internet的不断普及,电子投票的应用也越来越广泛。同时,人们对电子投票的安全性要求也越来越高。一般来说,电子投票的安全性需求包括私密性,有效性,合法性,公平
信息化加速了经济全球化,使人类生产和生活方式发生深刻变革。在信息化和经济全球化的大潮中,电子商务以高效、快捷、方便的优势,以全新的企业经营理念、手段、经营环境成为
基于计算机视觉的目标跟踪是计算机视觉领域的一个热点问题,在军事制导、智能视频监控、机器人视觉导航、人机交互、以及医疗诊断等许多方面有着广泛的应用前景。本文以智能视
机器人世界杯足球赛(The Robot World Cup,简称RoboCup),是典型的MAS(Multi-Agent Systems,简记为MAS)问题,可以用来评价多种人工智能理论、算法和体系结构。  强化学习是
所有计算机系统的安全性,几乎都取决于对密钥等核心秘密的可靠保护。但多数系统对密钥保护的安全程度很低,尤其在面临物理攻击时,往往会造成密钥的泄漏而丧失系统的安全性。
轮廓查询在涉及多标准决策的空间数据库、数据挖掘、测试观察、用户偏好查询、可视化等领域起着非常重要的作用,是一种典型的复杂查询。目前的研究主要涉及简单的轮廓查询,而
原子团簇的研究是凝聚态物理中的一个热门课题,而确定团簇的基态结构又是该领域中一项十分重要的基础性工作,因为团簇许多方面的性质都依赖于其基态结构。  现阶段,以实验