论文部分内容阅读
二十一世纪,科学技术日新月异,大量的信息和数据扑面而来,企业需要多角度处理海量数据并从中获取决策支持的信息,面向事务处理的操作型数据库就显得力不从心,而面向主题集成海量数据的集成型数据仓库应企业的需求,开始快速发展起来。数据仓库,即数据的集合,它的特点是相对稳定,主要功能是为企业提供服务,在企业的决策和分析问题中,不仅可以管理好企业的海量数据,还可以挖掘这些数据潜在的价值,从而使企业的资源得到最优化的分配,提高了企业资源的利用率,提升了企业的协同能力、竞争能力,并为企业注入新的活力,提高其创新能力。相对于国外企业而言,国内企业的信息化建设周期较短,而计算机技术的发展和企业业务的发展均很迅速,因此很多企业从信息化建设伊始,便忙于对信息系统的不断整合或升级,但是却忽略了对数据本身的管理。同时,数据质量的高低也同样能够对企业的发展起到至关重要的作用,低质量的数据会影响、甚至阻碍企业决策的准确性,相反,高质量的数据却可以推动企业对于决策的准确性的判断。目前,数据仓库已经得到企业的广泛认可,而随着它们在企业中的应用,数据的质量成为了越来越多企业所关注的问题,也成为了建设数据仓库项目的决定性因素。本论文在对大量文献做了调查的基础上,结合实际情况,采用理论研究、问题分析、实例验证等方法来研究数据仓库项目中的数据质量管理办法。主要研究内容包括:(1)通过对国内外数据质量的相关文献进行调查,研究,总结出数据质量的一些基本理论,并简单叙述了数据质量管理的一些方法论;(2)分析数据质量问题的来源、实质和产生环节,并对数据质量的检查提出了一些检查规则,并制定了检查过程,从而能够为确保数据质量找出有效的管理措施;(3)结合自身工作经验,以某银行所应用的数据仓库为例,对其所采取的数据管理系统进行分析、研究,从而为上面提出的有效管理措施提供可供参考的案例。