面向数据仓库的多表连接与聚集算法研究

来源 :太原科技大学 | 被引量 : 0次 | 上传用户:tiankuangfeng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据仓库和商业智能的作用在于为业务人员提供定制操作性和战略性业务决策所需的信息和工具,联机分析处理(OLAP)是数据仓库的主要应用之一。ROLAP是联机分析处理(OLAP)中使用最广泛的一种类型,其主要功能是管理决策所需要的总结数据。总结数据一般都涉及多表连接和分组聚集操作,提高这些操作的性能成为提高OLAP操作响应速度的关键。本文主要围绕ROLAP的海量数据聚集查询技术展开研究,对提高ROLAP聚集查询效率具有重要意义。主要研究工作如下:(1)给出一种改进的分组序号聚集算法IMuGA。该算法充分利用时间维表的特殊性,通过对事实表关键字直接获得分组属性值,减少了多表连接中时间维度的连接次数,提高了联机分析处理查询效率。实验结果表明,该算法是有效的。(2)给出了一种基于层次有序维的分组聚集算法。该算法在偏序和映射的基础上,通过定义层次有序维,利用维属性之间的聚集关系,通过约束层次链中的元素次序,实现了分组聚集计算中多表连接转换为维范围的查询,提高了连接和聚集效率。最后,实验验证了该算法的正确性和有效性。
其他文献
随着生存环境的变化,人类精子的质量已正悄然下降,这导致的不孕不育症问题已日益严重。临床精液检查是评价男性生育能力的一个常规手段,而精子形态学检查又是精液检查的重要
概念格是数据分析和知识提取的一种有效形式化工具,加权概念格是针对属性(项目)重要程度的不同,通过引入内涵权值而形成的一种格结构。频繁加权概念格是一种特殊的加权概念格
本文在研究GPRS-Internet网络和分布式测控技术的基础上,设计并实现了城市路灯远程监控终端。本系统采用了多种软硬件的抗干扰技术,易扩展性好,组态灵活,性价比高,有很好的通
随着Agent技术与电子商务相关技术的结合,基于Agent技术的电子商务模型逐渐成为学术界研究的热点。现有的电子商务系统对商务自动化方面的技术支持仍较为薄弱,尤其是在自动谈
为了适应互联网从有线网向无线网过渡,Intel适时推出了Atom处理器,同时发起Moblin项目,为Atom定制了MIDLinux。互联网与多媒体的紧密结合使得MIDLinux必须提供比传统Linux更加强
微粒群算法是一种模拟鸟类群体行为的随机型优化方法,由于其结构简单、收敛速度快和其本身容易实现的特点,因此在短短几年时间内,便获得了很大的发展,并在一些领域得到了成功
服务聚合技术在复杂异构的网络环境下为快速构建新程序的应用提供帮助,改变了传统的用户使用网络服务的方式。面对当前海量的互联网资源,虽然传统的用户使用服务的过程在服务
现实世界中,约束优化问题广泛存在于科学、工程、经济、国防等各个领域,随着优化问题复杂性的增加,传统确定性方法存在一定的局限性,为此寻求更有效的方法成为人们探索的热点
近年来,超分辨率图像复原技术在图像处理和计算机视觉领域逐渐成为热点研究方向之一。这一课题在安全监控、卫星遥感、医学影像、航空航天以及流媒体等领域都具有广阔的应用
MPI群集通信中的多对多通信在并行计算中有着大量而且重要的应用,例如在FFT和矩阵的运算中。多对多通信性能的优劣对于并行计算的性能有着很大的影响。随着机群系统广泛应用