论文部分内容阅读
Rough集理论是一种处理含糊和不精确性问题的新型数学工具。Z.Pawlak建立的Rough集理论有3个部分:(1)使用上近似和下近似表示知识的不确定性;(2)对数据的约简;(3)基于Roughness的推理。他把那些无法确定的个体都归属于边界线区域,而这种边界线区域被定义为上近似集和下近似集之差集,由于上近似集和下近似集都可以通过等价关系给出确定的数学公式描述,所以含糊元素数目可以被计算出来,从而实现了G.Frege的边界线思想。 Rough集理论在人工智能和认知科学研究领域有十分重要的应用;尤其为机器学习、知识获取、决策分析、数据库的知识发现、专家系统和模式识别等领域提供了一种很有效的新的数学方法。 本文主要研究内容如下: ■ Rough集中近似质量的新认识 在Rough集近似空间中提供了对一个对象集近似的准确性因子α和属性集间依赖程度因子γ。对于因子α可以给出精确性因子π与之比较;通过基于集合的距离度量公式,可以给出近似差错率来解释α,π和γ。如果把数据空间从1维拓广到k维,可以得到k维近似空间和相应的近似因子。 ■ 基于带状划分数据库的发现函数依赖集的方法 这种方法基于一致集的概念。根据一致集导出最大集及其补集,然后生成最小非平凡函数依赖集。通过使用带状划分数据库减少求一致集的运算次数,使用逐层求精的算法来计算最小非平凡函数依赖集的左部;并从时间复杂度上与其它方法进行了比较。 ■ 基于Rough集的数据约简 讨论用Rough集知识,对信息系统进行数据约简。给出用分明矩阵和分明函数的属性约简方法,对决策表的属性约简和属性值约简,以及最小决策化算法。 ■ Rough集与其它数据推理 讨论Rough集与概率逻辑,贝叶塞规则,证据理论和模态逻辑的关系,指出它们之间存在的一致性。 ■ 基于Rough集的形式化概念分析 形式化概念分析有助于数据的表达和分析。本文讨论用Rough集分别对一个对象集、一个特征集和由对象集与特征摘要 集形成的对的近似来形成各自的可定义的形式化概念。.Rough包含度统一Rough集中各种度量方式Rough集中提供了各种度量 方式,可以用Rough包含度的概念来统一这些度量,这有助于人们理解Rough 集的实质。