论文部分内容阅读
粗糙集理论是一种处理不精确、不确定和不完备信息的数据分析方法,现实应用中数据的规模和复杂程度不断增大,限制了粗糙集理论与技术的应用和拓展。决策信息系统分解作为一种数据转换方法,对于处理数据的海量性和复杂性,提高分析效率和质量有积极的作用。本文分析了大型复杂决策信息系统处理所存在的问题,阐述了决策信息系统分解的概念及其性质和优点,从对象集分解和属性集分解两方面详细论述了决策信息系统分解方法。基于属性重要度的对象集分解方法利用粗糙集理论中属性重要度为依据对对象集进行分解,具有较好的分类局部独立性和规则动态扩展性;基于属性依赖关系的属性集分解方法通过属性依赖度对条件属性聚类,完成条件属性集的分解,减小了子系统属性之间的复杂依赖关系。分别论述了两种方法的思想、步骤和算法,并分析其性质。决策信息系统分解后数据分析和知识获取的质量与分解方法密切相关,本文从计算时间复杂度、规则质量与分类准确率和分解前后决策等价性三个方面提出分解方法的评价指标,建立衡量分解质量的标准体系。对属性集分解中的决策等价性问题进行分析,分别提出决策信息系统论域和样本空间上的决策等价条件,以减小子系统决策存在的不确定性,避免分解带来的信息损失和分类结果的矛盾。通过实验仿真和UCI数据集的测试,对决策信息系统的对象集和属性集分解方法的性质与分解质量进行实验分析,说明了决策信息系统分解方法的可行性和有效性。