论文部分内容阅读
概念格理论,也叫形式概念分析,由德国Wille教授基于概念由外延和内涵两部分所组成的思想单元这一哲学理解首先提出,它作为形式化的数学方法,为数据分析提供了一种有效的工具。概念格本质上描述了对象和属性之间的联系,表明了概念之间的泛化和例化关系,其相应的Hasse图则实现了对数据的可视化。目前,形式概念分析已被广泛地研究,并应用到机器学习、软件工程和信息获取等领域。因此,研究概念格的基本理论以及将其应用于知识发现有着非常重要的意义。本文进一步研究了概念格的构造及属性约简问题,解决了概念格构造过程中的节点数量庞大和用概念格进行数据预处理过程中冗余属性过多的问题,主要成果如下:首先,讨论了概念格理论与粗糙集理论之间的基本联系;重点分析了形式概念与等价类之间、概念格与分划之间的关系;证明了概念格与分划之间可以相互转换。其次,通过对概念格的Bordat建格算法的深入分析,提出了一个改进算法,有效地克服了Bordat算法中结点重复产生的问题;提出了一种新的基于边缘概念的概念格生成算法,通过已求出的概念内涵及外延的交集和并集运算,分层构造概念格;还提出了一种新的模糊概念格,并讨论了它的性质以及构造方法,使计算出来的模糊概念更精确。最后,基于可辨别属性矩阵给出了概念格的属性约简的两个有效算法。