论文部分内容阅读
粗糙集(Rough Sets)理论是波兰学者Pawlak教授提出的一种处理不精确,不确定数据的有效工具。经过30多年的发展,粗糙集理论已广泛的应用于知识表示、数据挖掘、机器学习、模式识别与人工智能等研究领域。相较于经典 Pawlak粗糙集模型,基于相容关系的粗糙集模型可以较为合理的对论域进行分类,具备较好的容差性,因此成为近年来粗糙集扩展模型中的热点问题之一。 属性约简是保持信息系统某种分类特征的最小属性集描述,可以有效的压缩信息系统的规模并提供更为泛化的关联规则。许多学者在相容关系下的属性约简研究中做了大量的工作,但仍然存在如下两点问题:(1)基于相容关系的粗糙集模型的属性约简算法很多,但是缺乏系统性研究;(2)缺乏相容关系下对特定约简目标的属性算法研究。针对上述问题,本文系统分析了相容关系粗糙集模型算法;以区间值决策系统为研究对象,提出了两种规则保持约简算法;进而将置信度引入相容关系粗糙集模型中,提出了区间值决策系统下的分布保持约简。具体工作如下: 介绍了粗糙集的发展背景,对目前粗糙集发展现状进行了概述,系统的将现有的相容关系模型下的约简分为二元关系拓展模型,约简目标拓展模型和论域拓展模型三类,详细的分析了这三种拓展模型和经典模型之间的差异。简要介绍了粗糙集理论的基础概念。 以区间值信息系统作为研究对象对相容关系粗糙集模型进行研究。区间值决策系统是传统 Pawlak决策系统的扩展,区间值决策系统的知识约简是近年来粗糙集研究领域的热点问题之一。在实际应用中,由于信息本身具有的不确定性与不完备性,区间值决策系统往往以不协调的形式呈现。通过引入区间相似率,本文给出了区间值决策系统的α-相容关系与对应的上下近似算子;定义了不协调区间值决策系统的确定性规则保持与不确定性规则保持两种知识约简目标,并给出了相应差别矩阵的计算方法;对提出的两种约简与区间值决策系统的广义决策约简之间的关系进行了有效分析。最后,通过实验验证了相关结论的正确性。