论文部分内容阅读
知识发现是人工智能领域的研究热点,目前已经得到了很大的发展。然而,当前的知识发现还存在诸多重要的待解决的研究问题,如知识的表达方式过于单一、缺乏有效的复杂数据和复杂场景下的知识抽取方法(典型的场景如增量式数据情况)、缺少能够保持数据特征内在语义联系的高维数据降维方法,以及如何对发现后的知识进行有效性验证等等。 本文针对知识发现过程中的几个关键环节:知识的表达/描述方式,知识的抽取,知识降维,以及获取知识的有效性验证等,引入了粒度计算的原理和方法,对上述环节中存在的问题展开较深入的研究和探索: (1) 系统化提出了粒度计算三大原理:粒度知识表示原理、粒度近似求解原理、粒度问题映射原理。 (2) 采用了粒度划分的知识表达形式。通过引入粒度知识表示原理,将粒度的划分作为知识表达的一种形式,将粒度的不同粗细划分作为一种知识,从而提出了一种新的知识表达方式,通过对处理对象进行粒度划分来表达不同的知识。 (3) 提出了支持非一致数据的知识抽取算法。根据粗糙集理论设计实现了一个支持非一致数据的知识抽取算法,同时提出了一个适用于复杂情况的增量式知识抽取算法,并根据粒度近似求解原理提出了可并行/串行的近似规则抽取算法。 (4) 给出了知识抽取中的特征选取和约简方法。从表结构的数据特征所能容纳的数据记录问题出发,提出了数据饱和度概念,并根据数据饱和度的特性,提出了一个综合了属性约简和属性选取两者优点的数据降维方法。 (5) 应用知识发现方法来解决复杂问题,给出验证知识有效性的实例。即利用综合粒度方法中的三个原理解决古代建筑建模系统中的知识辨识过程问题。