论文部分内容阅读
随着WEB技术的日益成熟和企业信息化的广泛应用,大量的数据充斥在各个企业的业务系统中,如何有效利用这些资源,发现知识已经成为企业研究数据应用的热点。正是在这样的背景下,客户关系管理(Customer Relationship Management,简称CRM)系统应运而生。数据仓库及其挖掘技术能够创建预测客户行为的模型,帮助用户从大量的数据中抽取有用的信息,更好的支持企业决策者的工作。通过查阅资料了解了国内部分行业内如金融、电信企业等在数据仓库和数据挖掘应用方面的现状,发现这些企业已经有了比较好的信息化基础了,数据库中存储了大量的数据,但由于各种原因,如资金问题、专业技术人员等问题,在数据分析方面一直处于观望和准备的状态,而烟草工业信息化基础建设更薄弱。近年来,烟草工业利用信息技术生产和搜集数据的能力逐步提高,大量的数据库被用于管理、办公、科学研究和工程开发。如何高效地利用信息资源,保留现有客户开拓新市场,提烟草企业的核心竞争力,成为烟草工业信息化建设的核心问题。本文介绍了数据仓库和数据挖掘技术的发展现状和基本原理,讨论了数据仓库技术在烟草工业的应用意义;对烟草工业在CRM系统基础上组建数据仓库系统的理论和方法进行了深入的探讨,为数据仓库在烟草工业的应用提供了理论依据和实现方法;根据烟草工业的数据特点和业务需求,提出了烟草工业数据仓库系统的总体框架,深入讨论了业务系统数据到数据仓库环境的ETL技术,构建了烟草工业的数据仓库。本文重点研究了基于数据仓库的、面向烟草工业分析型CRM系统的设计和实现以及联机分析处理(On-Line Analytical Processing,简称OLAP)、数据挖掘技术在烟草企业CRM中的应用。本文在对目前我国烟草工业企业信息系统集成领域的需求分析基础上,结合经典解决方案的优点,首先在数据层实现整合,设计出适合我国烟草工业企业信息系统集成的基本框架。在该框架实现中,先分析企业数据仓库的技术需求,再从技术框架、数据库设计、数据建模、数据转换几个关键领域论述了数据仓库的实现。在数据模型设计中,对脏数据、异构数据源问题也做了相应的设计处理,保证了数据的有效性、准确性。本文提出的设计思想和相关研究对其他行业商业智能的开发也有着理论和实践指导意义。