论文部分内容阅读
数据仓库是面向主题的、集成的、稳定的、随时间变化的数据集合,旨在支持管理者决策。数据仓库技术在国外已经取得广泛的应用,而在我国的应用属起步阶段。轨道交通AFC(自动售检票)系统随着我国城市轨道交通事业的发展,得到了相当大的发展,并且己经建立了较完善的联机事务处理系统。多年的应用也使得轨道交通运营公司积累了大量的数据,其中隐含着大量有价值的信息。如何利用这些数据,深层次地挖掘信息,为运营决策服务,己成为轨道交通运营公司的当务之急。作者通过查阅资料了解了国内轨道交通行业在数据仓库技术和数据挖掘分析应用方面的现状,发现该行业信息化基础建设己经做得比较好,AFC系统也正在广泛应用,其数据库中存储了大量的数据。但由于各种原因,在数据仓库技术应用和数据分析方面一直处在观望状态,没有真正开展起来。本文分析了这种现状,针对应用上的问题,较为详细介绍了数据仓库方面的知识,如数据仓库的定义、结构,ETL(抽取、转换和装载)的定义、工具和应用过程,以北京和南京轨道交通AFC系统为基础,研究分析在该业务系统上建立数据仓库的一些过程和技术。本文介绍了数据仓库技术的发展现状和基本原理以及构建数据仓库的相关技术。根据AFC的特殊情况解决了建立数据仓库系统的基本问题,设计建立了符合DSS(Decision Support System)分析需求的数据仓库模型,重点提出并完成了两种针对AFC系统的ETL程序,实现了在数据仓库多维模型上的在线分析和数据分析报表展现,为数据仓库在轨道交通运营公司的应用提供了基本理论依据和解决方案。最后对系统进行了测试,系统运行平稳,性能良好,表明设计的ETL工具可较好的完成数据仓库的ETL需求,且具有易于使用,灵活性强的特点。