论文部分内容阅读
提出了一种基于类-属性关系依赖度的数据离散化方法,其特点是:借助统计学的λ相关系数,有效地捕获类-属性间的相互依赖,以此来选取最佳断点,并利用粗糙集属性依赖度分析方法,对实验数据进行有效分析,挖掘出对决策分析影响大的属性,去掉对决策分析影响小的冗余属性,以此构造数据挖掘模型.实例测试表明:该方法显著提高了决策树的分类学习精度,尤其在乳腺癌的症诊断上效果显著.