论文部分内容阅读
作为形式概念分析的核心数据结构,概念格在很多领域都得到了应用。但是,随着海量数据的涌现,概念格的完备性在完整的表达信息知识的同时,也大幅度提高了概念格模型的时间和空间复杂度,严重制约了概念格模型的发展。因此,以降低概念格模型的时间和空间复杂度为中心的概念格模型的简化研究,逐渐成为形式概念分析的一个重要研究方向。
目前概念格模型的简化研究主要是在保持概念格完备性的前提下展开的。例如形式背景的清晰化、标准化约简,概念格构造算法中的改进算法和并行算法等。在实际应用中,完全可以考虑牺牲一部分不太重要的概念节点来缩减概念格模型的规模,从而降低概念格模型的时间和空间复杂度。本文正是基于这一点而展开/研究的。
为了有效缩减概念格规模,本文提出了概念格模型的整体近似自相似度来度量各个属性子块的相关度。对于各个属性子块相关度不是很高的概念格模型,提出了基于富概念集的概念格模型的简化方法来实现概念格规模的控制。
基于富概念集的概念格模型的简化方法的基本思想是,对于属性子块相关度不高的概念格,用尽可能少的概念节点来表示尽可能多的信息知识,同时保持各个节点之间的偏序关系,在实际应用中,利用概念格自身特性进行信息导航时,能够找到这样一个子块,使得从顶点概念节点到底部概念节点,能够通过尽可能少的跳转,获得尽可能多的信息。
本文的主要内容如下:
(1)总结了概念格模型简化的已有方法,例如形式背景的约简、概念格构造时使用的剪枝算法、并行算法以及在实际应用中的概念聚类和同行映射等方法。
(2)提出概念格的整体近似自相似特性,来度量概念格模型中各个属性予块之间的相关度。分析得出结论如下:概念格的整体近似自相似度越小,各个属性子块之间的相关度越小,概念格各个节点间的区分度越高。
(3)对于各个属性子块之间的区分度较高的概念格模型,提出了基于富概念集的概念格模型简化方法。