数据仓库中多维数据压缩与CUBE计算研究

被引量 : 0次 | 上传用户:zeiwu158
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据仓库以传统的数据库为主要信息源,为联机分析处理(OLAP),决策支持(DSS)和信息挖掘(DM)提供了一个集成的数据环境,高效地组织和管理数据是实现数据仓库技术的关键之一。本文从数据仓库的多维数据压缩和聚集计算两个方面对这个问题进行了深入的研究。多维数据的存储和聚集计算是数据仓库研究的核心问题。本文首先介绍了数据仓库的概念、数据仓库的相关理论、数据仓库的设计过程、现有的多维数据模型理论及联机分析处理(OLAP)相关概念,这引出了对多维数据的存储及聚集优化策略的需求,也为继续研究多维数据的存储及聚集优化策略准备了理论基础。多维数据的逻辑组织方式是OLAP实现的关键之一。本文对这个问题进行了深入的研究,总结了多维数据的两种组织方式一关系方式和数组方式,重点研究了在数组方式中多维数据的存储结构、多维数组的建立方法、稀疏数组的压缩方法、数组分块的原则和分块数组访问方法,并在以上的理论分析的基础上提出了一个数组方式存储的方法。在数据仓库中计算多维聚集是提高OLAP性能的手段之一。本文总结了聚集计算的主要优化方法,对相关的概念进行了形式化定义,着重研究了数组聚集计算的优化策略,并提出了一种新的数组方式下的聚集算法,该算法运用了最小父亲、阶段扫描以及缓存结果的优化策略,加入了对于维内部的层次的聚集计算的支持,对于大数据量的计算,采用第三章的分块压缩的数组方式存储,算法将对数组的每一个逻辑块进行分别计算,计算完所有的划分后再把中间结果合并成完整的聚集结果。分析表明该算法达到了充分利用内存空间、减少I/O次数的目的。论文最后对研究工作进行了总结,并对进一步的研究工作进行了展望。
其他文献
<正>近年来,有不少文章报道了2型糖尿病患者Hp感染的情况,Hp感染对2型糖尿病的临床意义日益受到重视。本文应用14C尿素呼气试验,旨在探讨Hp感染与2型糖尿病中医辨证属胃热津
近年来,大跨预应力混凝土连续梁桥以其变形小、结构刚度大、行车平稳舒适、易养护、费用低等优点被广泛的采用。由于悬臂浇筑法在大跨预应力混凝土连续梁桥施工中的广泛应用,大
高分子表面活性剂是指分子由亲水基团和疏水基团两部分组成的、具有较高分子量(103~106)的物质。高分子表面活性剂既属于高分子的研究范畴,又可作为两亲分子形成聚集体。利用高分
研究了3种无机盐添加剂(NaCl、Na2CO3和CaCO3)对蚊香燃烧烟气和灰烬中多环芳烃(PAHs)分布规律的影响,采用GC-MS方法分析样品中16种优控PAHs的含量.结果表明,未加添加剂时蚊香
针对弱磁阶段电机转矩下降的问题,在弱磁阶段电压控制策略的基础上,通过适当的选择漏感,提出了一种简化的电压控制策略。采用该方法能够使电机在整个弱磁阶段输出转矩保持最
本文构建了引入金融摩擦的新凯恩斯动态随机一般均衡模型,运用1992-2012年的季度数据研究宏观审慎体制下金融摩擦强度与房地产市场之间的关系。结果显示:金融摩擦是宏观审慎
<正>农村金融综合服务站实现了各类服务功能的叠加,延伸了农村金融服务网络。为有效解决广大农村地区金融基础设施缺乏、金融服务缺失的问题,党的十八届三中全会作出了发展普
作为中国传统文化重要组成部分的巫文化,对中国文化发展的各个方面都起到过重大影响,包括文学创作也不例外。从文学起源的巫术发生说,到《周易》、《山海经》的出现,到数千年历史
对一高压涡轮导向器扇形叶栅进行试验,发现相邻测试叶片流场的周期性较差,给导向器气动性能试验评估带来极大困难。对试验件的数值模拟亦给出了相同结果。为提高试验评估精度
本研究从反思性教学的理论入手,首先概述了有关反思、反思性教学的概念以及日志作为一种理想的反思手段的研究状况,接着简述了社会建构主义与教师教育关联的几个理论,如情境学习