论文部分内容阅读
随着数据库技术的发展和信息时代的来临,各行各业都积累了大量的数据,数据库中存储的数据量急剧增加,航空航天、气象、医疗、农业等行业尤为突出,对这些数据进行分析以发现隐含在数据中的有用模式的要求变得越来越迫切,但目前还缺乏有效的智能手段,从而造成“数据丰富、知识贫乏”的状况。与此同时,人工智能领域的一个重要分支——专家系统的研究和应用近年来取取得了很大的发展,然而专家系统中也同样面临着知识获取的瓶颈。因此,一个新的研究领域——知识发现应运而生,由于蕴藏知识的信息大都存储于数据库中,数据库中的知识发现(Knowledge Discovery in Database,KDD)已成为当前知识发现的一个热点研究课题。 粗糙集是波兰的Z.Pawlak提出的一种新的处理不确定和模糊信息的数学工具,为知识发现中许多问题的解决提供了基础。本文前两章系统综述了知识发现的定义、知识发现的过程、知识发现的技术和方法、知识发现的功能、知识发现所面临的问题、粗糙集理论的思想、粗糙集发展的概况、粗糙集的基本理论和粗糙集理论在知识发现中的应用,然后本文对粗糙集理论在知识发现中的应用作了研究,本文作了如下四点工作: 1.本文通过实验证明第三章参考文献[3]中对Jelonek算法改进后的算法效果不理想。本文探讨了此算法不理想的原因,提出一种新方法改进Jelonek算法,主要通过辅助空间保存属性的信息和采用排序,在保证和Jelonek算法结果相同的情况下比第三章参考文献[3]更进一步降低了Jelonek算法的时间复杂度。本文所给的这个算法考虑了具体实现的限制,因而对不同大小的决策表采取有所不同的策略,算法的时间复杂度是不同的。由于粗糙集的可以处理不完全的数据,完全从数据本身得到信息等优点,已经得到广泛的应用,因此本文提出的高效属性约简算法有重要的实际应用价值。 2.从造成结果中存在冗余属性的两种原因和找到的属性集可能不是最小属性约简集两个方面对启发式属性约简算法完备性问题作了研究,对三种有代表性的启发式属性约简算法的各种情况都相应的用构造性的方法给出了例子,说 安徽人学硕十学位论义:倘出明这三种属性约简算法最后都需要消除冗余属性的步骤。在更充分的挖掘分明矩阵中信息的基础上提出一种新的基于分明矩阵的启发式属性约简算法,不需要消除冗余属性的步骤,并且可以克服属性受到不重要属性的千扰和属性间的相互干扰,通过实验验证了此算法。 3.本文指出有序决策表中还存在一种现有文献中没有提到的数据不一致,不仅在应用上进一步完善了对有序表的处理,而且在理论上丰富了粗糙集中不一致概念的内涵。排序和分类是人类的两种基本知识,一般文献中讨论的都是关于分类规则的挖掘,挖掘排序规则是一种新的思想,本文对挖掘排序规则的算法作了更为全面深入的探讨并加以改进。 4.开发了基于粗糙集的智能决策系统中的知识发现子系统,此系统应用于已经通过合肥市科学技术局的鉴定并推广使用的电子政务信息交换平台中,取得了满意的效果,促进了电子政务智能化进程,并且开发的知识发现系统也是作为国家自然科学基金项目的0273043)一智能软件体系结构和组件技术的研究的一部分。