论文部分内容阅读
随着数据库技术的广泛应用,产生了大量分散在各个行业的数据。面对大量繁杂而分散的数据资源,如何有效地管理和重组数据资源,提炼出有价值的信息以供决策使用,成为数据库发展面临的一个急于解决的问题。此时,数据仓库与数据挖掘技术的产生和发展为这个问题的解决提供了有效的理论和方法指导。
论文以南京某公司的HSE安全管理体系为背景,在以南京工业大学控制工程中心已开发的南京某公司HSE信息管理系统基础上,提出了面向分析的数据仓库与数据挖掘的解决方案。该方案从决策角度出发,主要针对HSE安全检查业务模块建立多维数据模型,将原系统中的历史数据加以处理,并有组织的存放到数据仓库。在此基础上,利用OLAP和数据挖掘技术,对数据仓库中的数据进行各种复杂分析,从而为安全整改方案提供重要的依据。
论文对数据仓库与数据挖掘的关键技术进行了详细研究,主要研究内容如下:
(1)分析了数据仓库的设计过程,研究了数据仓库与传统数据库的区别、数据仓库体系结构等,着重讨论了数据仓库的维度建模技术;并且研究了联机分析处理技术。
(2)阐述了数据挖掘的基本原理,研究数据挖掘的任务和常用算法以及说明了数据仓库中、OLAP和DM之间的关系。
(3)对SQL Server2005的组件进行详尽的阐述,着重研究IntegrationServices服务和Analysis Services服务。
(4)在上述关键技术研究的基础上,以HSE信息系统为研究对象,设计HSE数据仓库模型,在SQL Server2005平台上创建数据仓库,对其进行OLAP分析和数据挖掘。
论文主要针对石化企业的HSE信息管理系统上的数据进行数据分析与数据挖掘的积极尝试,提出一个相对完整的解决方案,对石化企业的HSE信息化管理平台的数据分析具有一定应用价值。