基于覆盖粗糙集理论决策树的构造

来源 :华北电力大学(北京) 华北电力大学 | 被引量 : 0次 | 上传用户:sanhaijin123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
粗糙集是一种用来处理不精确、不确定数据的数学方法,可以用来发现隐藏在数据中的知识。粗糙集理论已经成功地应用到机器学习、数据挖掘、模式识别等领域。属性约简作为粗糙集研究的核心内容,可以删除决策系统中的冗余属性,提高工作效率,节省存储空间,降低系统计算的复杂度。经典粗糙集通过属性对论域划分定义等价关系,仅可以处理属性取值为单值的数据集,对于样本取值为集值、缺失值的一些特殊问题还不能解决。覆盖粗糙集通过覆盖代替划分解决属性取集值的问题。决策树学习是一种逼近离散值函数的分类方法,其核心任务就是把所有样例分类到离散值所对应的类别中。目前,决策树已成功地应用到文本学习、信用风险评估和天体分类等众多领域。现对本文的主要工作总结如下:1.在第三章中,对于不一致的集值决策系统,定义了一种基于覆盖粗糙集的,且保持置信度较高的可能性规则的置信度不低于给定阈值的θ-属性约简,推广了基于覆盖粗糙集的属性约简。本文通过辨识矩阵中的极小元素计算θ-属性约简,既可以删除决策系统中的冗余属性,降低决策系统的计算复杂度,同时可以处理决策系统的噪声与不一致性。2.在第四章中,针对不一致决策系统,本章通过信息增益与置信度生成决策树。在决策树的生成过程中,利用信息增益选取结点,根据置信度确定决策树中规则的长度避免过度拟合,及早停止树的增长。此算法不仅提取了所有置信度不低于给定阈值θ的可能性规则,而且省去了对决策树修剪的步骤,并通过置信度刻画决策树中的可能性规则。由此构造的不一致决策树不仅结构简单,而且包含了所有置信度不小于阈值的决策规则,可以刻画决策系统的不一致性。在本章最后部分,我们通过数值实验验证了不一致决策树算法的可行性。
其他文献
马氏链作为描述一类实际问题的数学模型,在经济学、生命科学、随机服务系统、计算科学、随机分形等领域中取得了极为丰硕的成果。信息论中的马氏信源是一种很重要的信源,如实际
现在,我们已然步入一个信息时代,图像处理的应用也已经非常普遍了.而图像盲恢复是图像处理中很重要的一个应用,它的目的是:在退化过程的先验信息不完整的前提下,通过相关技术