基于粗集理论的知识发现研究

来源 :安徽大学 | 被引量 : 0次 | 上传用户:red0035
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数据库技术的发展和信息时代的来临,各行各业都积累了大量的数据,数据库中存储的数据量急剧增加,航空航天、气象、医疗、农业等行业尤为突出,对这些数据进行分析以发现隐含在数据中的有用模式的要求变得越来越迫切,但目前还缺乏有效的智能手段,从而造成“数据丰富、知识贫乏”的状况。与此同时,人工智能领域的一个重要分支——专家系统的研究和应用近年来取取得了很大的发展,然而专家系统中也同样面临着知识获取的瓶颈。因此,一个新的研究领域——知识发现应运而生,由于蕴藏知识的信息大都存储于数据库中,数据库中的知识发现(Knowledge Discovery in Database,KDD)已成为当前知识发现的一个热点研究课题。 粗糙集是波兰的Z.Pawlak提出的一种新的处理不确定和模糊信息的数学工具,为知识发现中许多问题的解决提供了基础。本文前两章系统综述了知识发现的定义、知识发现的过程、知识发现的技术和方法、知识发现的功能、知识发现所面临的问题、粗糙集理论的思想、粗糙集发展的概况、粗糙集的基本理论和粗糙集理论在知识发现中的应用,然后本文对粗糙集理论在知识发现中的应用作了研究,本文作了如下四点工作: 1.本文通过实验证明第三章参考文献[3]中对Jelonek算法改进后的算法效果不理想。本文探讨了此算法不理想的原因,提出一种新方法改进Jelonek算法,主要通过辅助空间保存属性的信息和采用排序,在保证和Jelonek算法结果相同的情况下比第三章参考文献[3]更进一步降低了Jelonek算法的时间复杂度。本文所给的这个算法考虑了具体实现的限制,因而对不同大小的决策表采取有所不同的策略,算法的时间复杂度是不同的。由于粗糙集的可以处理不完全的数据,完全从数据本身得到信息等优点,已经得到广泛的应用,因此本文提出的高效属性约简算法有重要的实际应用价值。 2.从造成结果中存在冗余属性的两种原因和找到的属性集可能不是最小属性约简集两个方面对启发式属性约简算法完备性问题作了研究,对三种有代表性的启发式属性约简算法的各种情况都相应的用构造性的方法给出了例子,说 安徽人学硕十学位论义:倘出明这三种属性约简算法最后都需要消除冗余属性的步骤。在更充分的挖掘分明矩阵中信息的基础上提出一种新的基于分明矩阵的启发式属性约简算法,不需要消除冗余属性的步骤,并且可以克服属性受到不重要属性的千扰和属性间的相互干扰,通过实验验证了此算法。 3.本文指出有序决策表中还存在一种现有文献中没有提到的数据不一致,不仅在应用上进一步完善了对有序表的处理,而且在理论上丰富了粗糙集中不一致概念的内涵。排序和分类是人类的两种基本知识,一般文献中讨论的都是关于分类规则的挖掘,挖掘排序规则是一种新的思想,本文对挖掘排序规则的算法作了更为全面深入的探讨并加以改进。 4.开发了基于粗糙集的智能决策系统中的知识发现子系统,此系统应用于已经通过合肥市科学技术局的鉴定并推广使用的电子政务信息交换平台中,取得了满意的效果,促进了电子政务智能化进程,并且开发的知识发现系统也是作为国家自然科学基金项目的0273043)一智能软件体系结构和组件技术的研究的一部分。
其他文献
本论文的研究就是从现代物流运输系统的重要性出发而展开的,论文全文包括五章内容以及结论与展望部分。第一章简单介绍了物流的概念和发展现状,并且介绍了GIS的概念、数据组织
数据挖掘作为知识发现过程关键技术,已逐步得到广泛应用。分类是数据挖掘及CRM的重要组成部分。SLIQ串行算法是由IBM Almaden 研究中心提出的一种高速可伸缩的分类算法,广泛应
随着网络的迅速发展,人们对视频的需求越来越强烈。视频服务对带宽的要求很高,使得这些服务不能在Internet上得到很好地应用,而CATV网能够提供稳定高速的下行带宽。如何结合CATV
机群高性能计算系统是高性能计算和信息服务的基础设施,正日益受到科技界,各国政府的重视.如何有效地共享这些分布的、异构动态的机群高性能系统的资源,提供各种并行计算环境
WebGIS技术是目前GIS应用的重要前沿,它对地理信息中空间相关数据的采集、管理、分析和显示等特点若能引入到网上房展系统中,将大大改善目前现存系统对位置、环境等空间信息表
中科大网格研究组承担了国家863项目—"合肥网格节点的建设及若干典型网格应用的研制","中科大网格Portal的研制"是其中的一个子项目.该文作者承担了中科大网格Portal的主要
Internet的产生可以说是一种文明时代发展的必然,但同时也是人类在科学技术的探索过程当中的一次偶然。随着网络多媒体、网络高性能计算、用户移动接入、海量信息存储和处理
持久性对象是指能存在于应用程序生命周期外的数据,它们通常被存储在数据库中,最常用的关系数据库。人们开发的应用程序的一个基本任务就是产生、修改和查看这些数据。然而当开
20世纪90年代,WWW(World Wide Web)出现以来,Internet上的信息量正以前所未有的速度飞速发展,这也使得用户在Web上迅速、准确地获取所需信息变得越来越难。从用户的角度来看,希望能
本论文的设计工作是开发一种功能齐全、性能优异的CMOS线性稳压器NPU3965,该芯片具有低漏失电压、低功耗、低噪声,且实现芯片快速启动及关断快速放电等特点.论文详细论述了低