论文部分内容阅读
联机分析处理(Online Analytical Processing,OLAP)是数据仓库提供的重要服务之一,也是用户获得决策支持的主要手段。OLAP查询通常需在海量数据上进行即席的复杂查询,及时向用户提供分析数据,且系统用户能够对数据进行多方位地,深入地分析;随着实际应用的运行,用户有更新分析的角度和数据的需求。使得如何提高OLAP查询、分析操作效率以及更好地维护多维数据模型成为数据仓库应用中的关键问题。本文着重对以上的问题进行了系统深入的研究。在上海移动经营分析系统的数据仓库环境下,提出了一种实用性的基于索引的启发式查询优化方法,并结合了MDX(Multi-Dimensional expressions)多维查询技术,有效地提高了OLAP的查询效率、多维数据分析操作的效率。同时在传统的多维数据模型的基础上,提出了一个基于维层次更新的多维数据模型,该模型具有更好地支持多维数据模型维层次更新的优点。本文做的主要贡献有:(1)提出了一种基于索引的启发式查询优化方法。该方法通过考虑评估开销的阀值,减少带有索引的事实表的扫描次数;先执行连接运算,避免带有索引的多事实表连接时,嵌套子查询索引的丢失,从而提高CPU的执行效率。实验证明,该方法在查询处理代价和执行时间上比传统的启发式查询方法都明显减少。特别是当事实表的数据量增加时,该方法可以更有效地提高OLAP的查询效率。(2)提出了一个基于维层次更新的多维数据模型。本文通过在传统模型上增加Bh ole和使用占位符的方式,解决维层次结构数据实例的更新中引起的数据聚集可汇总性的正确性问题,使其更具灵活性和可扩展性,且该模型可以更全面地解决维的层次结构(维等级属性、维等级、维等级间关联)更新操作。结合实例分析证明了该模型的有效性和具有很强的实用性。