论文部分内容阅读
该文首先论述了知识管理是最近新兴起来的综合性研究领域,它是对企业中所有的信息资源(包括数据库、文档、企业政策方针、过程手续等,甚至包括存在于员工头脑中的工作经验与专业技能等非具体化的信息资源)进行收集、组织、共享、分析等,从而谋求更大应用目标的综合研究学科.知识发现和知识挖掘是知识管理的重要.CIMS在某种程度上说,实质就是信息集成.对集成的海量数据做必要的分析与挖掘,才能去伪存真,得到企业想要的信息.然后,该文讨论了为满足管理的决策分析需要,在数据库基础上产生了能够满足决策分析所需要的数据环境——数据仓库.数据仓库具有这样一些重要的特性:面向主题性、数据集成性、数据的时变性、数据的非易失性、数据的集合性和支持决策作用.数据仓库在创建以后,首要要从数据源中抽取所需要的数据到数据准备区,在数据准备区中经过数据的净化处理,再加载到数据仓库数据库中,最后根据用户的需求将数据发布到数据集市/知识挖掘库或数据仓库进行决策查询分析或知识挖掘.接着该文描述了数据挖掘.它是按企业既定业务目标,对大量的企业数据进行探索和分析,提示隐藏的、未知的或验证已知的商业规律,且进一步将其模式化的数据处理方法.最后,该文以昆明云内动力股份有限公司的销售为背景,开发数据仓库,然后进行数据挖掘.主要工作包括了设计数据仓库架构、转移数据、创建多维数据集、分析数据.该文在设计数据仓库架构时,主要是分析公司对系统的需求,然后识别并设计事实表与维度表,再从现有的数据库中提取数据,实施数据转换,从而创建数据仓库.在选择数据源时,分别讨论了从OLTP系统和Access数据库中抽取数据的技术.在创建好的数据仓库基础上,运用决策树方法和聚类方法来创建数据挖掘模型.