论文部分内容阅读
随着数据库技术的迅速发展以及数据库管理系统的广泛应用,数据呈海量增长,出现了“数据爆炸但知识贫乏”的现象。我们必须处理大量数据并从大量数据里得到隐藏其中的规律。在这种情形下,数据挖掘作为处理海量数据的工具便应运而生了。粗糙集理论与方法对于处理复杂的系统不失为一种较为有效的方法。它能有效地分析和处理不精确、不一致、不完整等各种不完备信息,并从中发现隐含的信息。本文对数据挖掘和粗糙集理论的基础知识进行了必要的说明。在研究数据挖掘的一般过程的基础上,深入分析了基于粗糙集的数据挖掘的过程,并对应用于这些过程的算法进行了研究和分析。本文所做的工作主要有以下两点:1、对粗糙集理论的属性约简算法进行了比较深入的研究。属性约简算法是基于粗糙集理论的数据挖掘模型中的关键步骤。通过比较不同的属性约简算法,针对不同算法的缺点,提出一种基于约简树的属性约简算法。该方法减少了生成和存储区分矩阵的时空开销,简化了获取决策系统全部约简的过程。2、对粗糙集理论的属性值约简算法及基于粗糙集的数据挖掘在通信领域中的应用进行了比较深入的研究。该部分介绍了属性值约简的基本算法,针对基本算法的不足,介绍了改进后的属性值约简算法。并对改进的算法进行实例分析,将其应用在通信领域中,并给出实验分析及结论。