论文部分内容阅读
数据挖掘工具广泛地应用于解决工程、科学研究、商业中的问题。本文论述了数据挖掘技术概念、现状以及与数据仓库、数据集市、数据矿藏的联系,比较了数据挖掘与在线分析处理(On Line Analysis Processing,OLAP)之间的区别,重点讨论数据挖掘技术中关联规则、粗糙集以及与可拓信息的结合,分析它们的优缺点,适用性。关于关联规则和可拓信息,进行了有关学生课程之间关联分析;对粗糙集和可拓信息,进行的是感冒病人具有的症状的分析,通过建立一个关于大型企业物资部门的数据集市,讨论数据集市中的数据存储模式,数据查询的实现和关于应用决策树分析客户模式,应用关联规则等分析商品销售模式和Internet上数据收集、数据挖掘的分析研究,对不同的问题应用不同的挖掘算法,得到了较满意的结果,为决策提供参考。 技术的发展是社会发展和应用驱使的结果。通过学习研究、分析比较数据挖掘技术,认识到数据挖掘技术尤其强调与应用的结合。数据挖掘所得的分析结果是服务于决策层的,所以产生的影响无论是正面的或是负面的都是深刻的。