论文部分内容阅读
Rough 集理论是近年来发展起来的一种有效的处理不精确、不确定、含糊信息的数学理论方法,在机器学习、数据挖掘、智能数据分析、控制算法获取等领域取得了很大的成功。
Rough 集理论的研究有两种不同的方法,即代数观方法和信息观方法。在以往的研究中,许多学者认为这两种观点是等价的,所以认为这两种观点下得到的约简结果也是等价的,概念也可以相互直接引用。王国胤教授经过认真研究这两种观点中定义的 Rough 集理论,发现这两种观点不是等价的。
属性约简是知识获取中最重要的部分之一。决策表核属性的确定往往是信息约简过程的出发点和关键。以前的 Hu 的可辨识矩阵求核算法可用来求相容决策信息系统中的核属性,叶东毅改进 Hu 的求核算法,可以用来求不相容决策信息系统在代数定义下的核属性;王国胤提出了 Rough 集理论信息熵定义下的核属性的计算方法,可以用来求不相容决策信息系统在信息熵定义下的核属性。
本文在研究信息熵定义下的核属性和代数定义下的核属性之间差异的基础上,进一步分析了二者之间的关系,根据不同的条件属性在决策表中所起的作用不同,对决策表条件属性进行了分类,一共分为 5 类属性。本文对决策表在代数观和信息观下的属性约简进行了比较,并提出了基于信息熵的可变精度 Rough 集模型。通过仿真实验得到了两者在不同情况下的差异的量化统计分析结果,说明了Rough集理论信息观在不同情况下对代数观的包含关系的不同状态。