粗糙集理论在知识发现中的应用

来源 :兰州理工大学 | 被引量 : 2次 | 上传用户:chrisdc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
粗糙集理论是一种新型的处理含糊和不确定性知识的数学工具,它能够分析隐藏在数据中的事实,且不需要关于数据的任何附加知识。该理论以其独特的优势赢得越来越多的研究者的关注,并在各个领域得到了广泛的应用。本文的研究工作主要包括以下几个方面: (1) 偏好关系下的最优约简:现有粗糙集中求取所有约简的算法是典型的NP-问题,这在一定程度上限制了粗糙集理论的广泛应用,其中的一个主要原因是在求取约简的过程中可能同时存在多个可以缺省的属性,删除不同的属性将形成不同的约简,因此在选择可以删除的属性时存在冲突。在研究过程中,我们采用了人工智能领域中解决冲突的办法—偏好关系,在属性上加上偏好关系后,约简在该偏好关系下是有序的,通过对特殊情况的归纳,我们设计了一种特殊的树,并由此得到了获取偏好关系下的最优约简的算法。最后,通过在属性的可缺省性与函数依赖之间建立对应关系,我们改进了算法,提高了其有效性。 (2) 粗糙集理论与熵理论:在粗糙集理论中,知识被看成是一种分类能力,即在域上构造分区的能力。从信息论的角度上讲,知识是那些对我们有用的信息,而信息是从数据中提取出来的,对于信息中的数据存在着不确定性,信息论中采用熵这种尺度来量化地衡量这种不确定性。因此,在粗糙集理论中运用熵理论衡量知识具有理论上的可行性。研究过程中,我们提出了知识熵的概念,从代数的角度讨论了知识熵的性质,并从粗糙集理论的核心之一——属性的可缺省性出发,在粗糙集理论的基本概念与知识熵之间建立对应关系,通过这种机械式的数字计算来得到粗糙集理论中的一些基本概念,如约简,核等。 (3) 基于偏序关系的粗糙集理论扩展:在现有的研究成果中,已经有着许多对粗糙集理论进行的扩展,如基于容差关系的扩展,基于相似关系的扩展等。研究针对Sai,Ying与Yao,Y.Y.提出的在有序信息表中进行挖掘的方法,提出了一种基于偏序关系的粗糙集理论框架,并可以在此框架下挖掘任何有序信息。算法分析与实验表明,该方法的复杂度是前述方法的1/n~2,其中n是域中所含的样本数。
其他文献
本文在介绍相关研究背景及关键技术的基础上,主要从应用的角度以数据仓库技术为基础,针对银行卡业务,进行了银行卡业务的需求分析;设计了适合银行卡业务的决策支持系统框架:确定分
随着计算机网络、通信网络以及分布式系统的不断发展,通信协议有日渐复杂化的趋势,形式描述技术在网络协议设计中占有举足轻重的作用,作为国际化标准之一的LOTOS技术是专为分
我们生活在一个信息化的社会中,信息高速公路是我们传递信息的载体,而网络是这一载体的核心。互连在一起的网络要进行通讯有许多问题要解决,路由选择是其中重要的内容。正确
  近些年来,PACS(PictureArchivingandCommunicationSystem)系统的应用已从原来局限于放射科的数字化的医学影像管理,发展成为以数字化诊断为核心的整个影像管理过程,这里我们
并行分布式系统是计算机行业和日常生活中不断增长的应用领域,特别是在分布式计算、工业控制、军事航天领域、以及商务应用等。对实现有如此关键性应用的分布式系统来说,努力
随着嵌入式系统的应用越来越普及的趋势,嵌入式系统的开发者也越来越多。虽然主流的嵌入式CPU都已经将昂贵的实时在线调试器内置在芯片中,但还需要具备一定的软硬件辅助才能实
近年来,随着计算机技术和多媒体技术的发展,大量的图像数据不断涌现,图像检索技术成为当今一大研究热门课题。 本文首先介绍了图像检索技术的发展历史,对基于内容的图像检
Web信息获取存在已经有十几年的历史,近年来网络信息量飞速增长,使得传统的综合性信息获取的发展变得越来越困难,他无法及时的收集所有信息,而且由于信息数量太多,在准确率上
在对移动操作系统的理论学习与关键技术研究的基础上,结合目前相关系统与技术的发展现状,预测未来的发展趋势,深入研究了Android移动操作系统的安全性原理和关键开发技术,以及一
基于视频监控系统的车型分类作为智能监控系统研究的一个分支,已经成为国内外研究的热点之一。车型分类作为交通管理、收费、调度和统计的依据,该项课题的研究不但具有重要的