基于Dwarf的语义OLAP关键技术研究与实现

来源 :东北大学 | 被引量 : 0次 | 上传用户:chengm1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
OLAP技术是决策支持系统中的一种重要技术,用于管理人员决策分析。为了提高响应速度,需要对数据立方进行预计算。数据立方的计算在数据仓库中是非常必要但代价很大的操作。有效的数据立方(CUBE)计算成为研究的热点之一。 CUBE计算是OLAP即席查询分析的基础。CUBE操作内在的困难是计算代价和存储大小问题。一些文献提出了对CUBE计算的操作,包括并行性的应用、字符型映像到整型等,都是为了减少存储。但是随着新的应用,问题加剧了。比如,维数的增加和由此导致的CUBE大小爆炸性增长问题。其它文献已经提出了一些办法解决存储大小问题,而压缩的CUBE能同时减少计算时间和占用的空间。 Dwarf数据立方是一种高度的压缩结构,同时保持CUBE的语义,使OLAP查询易于实现。Dwarf数据方体将具有相同前缀和后缀的数据元素(Cell)压缩存储在一起。一般来说,数据方体在数据密集的地方前缀冗余比较多,数据稀疏的地方后缀冗余比较多。Dwarf数据方体存储时,消除了这两种类型的冗余,大大缩减了数据方体的存储空间。将一个完全实例化的数据方体缩减到一个非常紧凑的数据结构中。 本文研究了基于Dwarf的语义CUBE压缩技术。针对现有的Dwarf结构在实现过程中遇到的频繁I/O访问问题提出了改进算法—Q-Dwarf。另外,在实现基本Dwarf数据立方的基础上,进一步研究了以下几个问题。(1)为了更好的支持范围查询,研究并实现了聚簇算法。(2)实现了Dwarf数据立方的增量维护,研究并实现了基于三角形的增量更新算法。(3)为了更好的支持OLAP操作,研究并实现了基于文件的索引技术,实现其点查询和范围查询。大量实验表明,Q-Dwarf算法较原算法性能有明显提高,而且无论是在元组数较多的情况下还是在维数较多的情况下,我们算法的实现性能都较好。
其他文献
这篇论文主要解决的课题是基于ISG平台的电信增值业务的研究和开发,智能服务网关(ISG)给网络运营商提供了一个向业务服务提供商和第三方客户应用开发商开放其网络资源的标准的
超声图像诊断是与X线CT、同位素扫描、核磁共振等一样重要的医学图像诊断手段。超声检查能够无损、直观地显示人体脏器的形态结构,能实时地观察人体脏器的功能活动而且操作简
随着计算机科学技术的发展和普及,特别是计算机在国民经济中的广泛应用,作为计算机灵魂的软件在社会生活中,尤其是在现代企业中得到广泛的应用。拥有优秀的跨平台特性的Java
本文对汉语术语的抽取进行了一定的研究,设计了一个统计方法和规则方法相结合的汉语专业领域术语抽取算法,并具体实现。在本文的实验系统DSTES中,共有四个核心模块:预处理模块,对
作为支持向量机和神经网络应用研究的重要补充和发展,针对目前用于生产生活的监视、监控系统的广泛重视,本文提出了基于视频图像的MPEG4 压缩方式和支持向量回归与径向基函数
计算机技术的迅猛发展使得人们创作、使用数字多媒体作品变得越来越容易,并由于互联网技术的发展又极大的推动了数字多媒体作品的广泛传播,一幅好的数字多媒体作品可以在一夜之
本文介绍了目前在国内电信业发展迅速的PHS无线市话网络和它的GIS体系结构和特点,介绍了PHS GIS系统的建立过程和GIS系统在PHS网络中全方位的应用,说明了GIS相比传统DBMS系统在
序列模式挖掘是指挖掘相对于时间或其他模式出现频率高的模式,是数据挖掘的一个重要分支。在交易数据分析,病症分析,Web日志分析,天气预报等领域具有广泛的应用前景。 本文选
近年来,随着全国煤矿企业加大煤矿开采力度,煤矿事故也逐年增加。作为我国西南地区的煤矿重镇,重庆南川煤矿辖区内各大中型煤矿也发生了多次矿难,不仅扰乱了南川矿区的正常生
随着车载自组织网络的快速发展,出现了一系列引人注目的车载应用。但由于车辆节点的高速移动,车辆之间很难维持稳定的网络连接,传统的MANET中的路由协议已经不能够充分满足VANET