论文部分内容阅读
随着计算机和互联网技术的快速发展,海量的数据和各种信息资源不断产生。人们渴望从丰富的数据中获取更多的知识,于是出现了各种“海量数据”与“知识匮乏”的局面。作为知识获取的一种手段,而且还可以处理不确定信息,粗糙集理论近年来发展迅速。属性约简和规则提取是粗糙集理论研究的核心内容,同时也是知识发现领域的重要研究课题。高效快速的知识约简算法一直都是粗糙集研究者们努力研究的方向和热点问题。粒计算作为近些年来发展起来的一门新学科,其在人工智能、机器学习、数据挖掘、模式识别以及故障诊断等领域取得了不少的研究与发展。人们总是渴望从多方面分析和解决问题,而粒计算是从多粒度方向解析问题、从各个粒度求解问题并最终合并各个粒度的解构成原始问题的解,这符合人类的认知规律,因此受到了各学科领域研究工作者的广泛关注,也成为了复杂问题、智能信息处理的一种新的计算方式。本文从研究粒计算和粗糙集理论出发,重点研究属性约简和规则提取。具体从以下几个方面开展了相关工作:(1)首先,将粒计算理论中的粒化思想运用到决策表的粒化表示上,研究如何刻画和表示信息粒(等价类),在知识粒度的基础上定义了粒度空间的概念;(2)重点分析条件等价类(信息粒)与决策等价类(信息粒)之间的关系,用粒矩阵表示条件信息粒和决策信息粒,用粒关系矩阵表示信息粒之间的关系,并将此关系映射到属性约简和规则提取的问题上,定义了相关性质和定理并给出了相应证明;(3)在属性约简的研究上,分别从研究一致决策表和不一致决策表出发,设计并提出基于粒计算的属性约简算法,对算法进行实例验证并分析了算法的复杂度,最后,将本文的属性约简算法同几种常见的属性约简算法进行了总结和比较,分析了本文算法的优势和不足,提出进一步的研究方向;(4)关于规则提取,结合粒关系矩阵重点研究了信息粒之间的包含关系,定义了相应的性质、定理以及启发式算子。然后,分别对一致决策表和不一致决策表设计基于粒计算的规则提取算法,对算法进行了实例验证和分析,并与同类算法进行了UCI数据集测试,测试结果表明了本文算法的优越性和有效性;(5)最后,在本文算法的基础上,在MATLAB开发环境中设计并实现了基于粒计算的知识约简系统。