知识获取算法研究

来源 :重庆邮电学院 重庆邮电大学 | 被引量 : 0次 | 上传用户:ziyoucunzai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
粗糙集理论是一种新的处理模糊和不确定知识的软计算工具。它能有效地分析和处理不精确、不一致、不完整等各种不完备信息,并从中发现隐含的知识,揭示潜在的规律,近年来在机器学习、数据挖掘等多个领域得到广泛应用。粗糙集是知识获取的一种方法。作为当前的研究热点,在知识获取的研究中尚存在一些问题未能解决,我们对其中两个主要问题--求核问题和增量式知识获取模型进行了研究和讨论,得到了较好的结果。属性约简是知识获取中最重要的部分之一。决策表核属性的确定往往是信息约简过程的出发点和关键。以前的可辨识矩阵求核算法由于忽略了某些因素而产生错误结果,叶东毅在新的求核算法中虽然把错误改正了,但算法复杂度明显提高。本文在定义的合并规则的基础上提出一种求核算法,该算法不仅改正了以前可辨识矩阵求核法的错误,而且在性能上优于叶东毅和Hu Xiaohua的求核算法。近几年在粗糙集理论研究中对求解属性的最小约简或较小约简以及求取最简规则集[1-3]的算法已经进行了一些研究,但这些研究都是针对静态数据的。而数据库是动态的,因此许多研究者建议[4-6],数据库知识发现算法应该是增量式的。属性最小约简的增量式算法以及增量式更新概念格的算法已经开始被研究,但对于增量式的知识获取算法的研究工作还比较少。   本文在以上工作的基础上,研究了增量式知识获取问题,发现当把知识的树结构和粗糙集的知识获取思想进行结合后,对于增量式学习的数据可以取得好的学习效果。在此基础上,我们提出基于粗糙集和规则树的增量式知识获取算法(RRIA)。实验表明,RRIA比传统粗糙集知识获取算法不仅具有更快的学习速度,而且生成的规则对样本的识别率可以达到甚至超过传统粗糙集知识获取算法;同时,我们还把RRIA算法与ID4算法进行了比较测试,结果表明RRIA算法无论规则的质量还是正确识别率都优于ID4算法。
其他文献
该文主要叙述了基于CAN(控制器局域网)总线热网监控系统的设计及其监控主机软件的实现.该系统是一个工业现场的监控系统,适用于分布式供热网的换热首站,实现对热网首站的实时
空间数据库[1,3,4,5]在GIS[2]中的作用与地位越来越重要,并将成为GIS产业之争的主导者之一。空间数据信息不仅有一般属性信息的特征,还具有数据量大、多尺度等特性。因此为了高效
该文首先介绍了聚类分析定义,相关概念.之后对现有的聚类算法作了一个分类.并对各类算法作了简要的说明.该文重点讨论了基于图的算法:我们提出了一个基于图的聚类方法.它具有
该文主要研究了脉冲耦合神经网络(PCNN--Pulse Coupled Neural Network)的运行行为、离散PCNN的自动波传播特性和基于改进型PCNN的图像分割及其在图像压缩中的应用.首先分析
多体系统是由多个刚体或柔性体相互联结构成的通用机械系统模型,多体系统的分布式仿真、动态分析与优化等是目前机械系统计算机辅助分析研究的重要方向。 机械系统计算机辅
目前虽然面向对象的程序设计方法在全世界范围内得到广泛应用,但相对而言对面向对象软件测试方面的研究却是严重滞后的。随着人们发现传统的软件测试技术和方法在测试面向对象
该课题详细剖析了Java安全系统所具有的主要技术,并利用Java安全模型API对相关技术难点做了完整的编程(包括消息摘要,数字签名,密钥管理,数字证书验证),在此基础上对专利管理
水路航运系统是运输系统中很重要的一部分,而航道的正确标识是船舶运安全的重要保障.在中国长达数千公里的河道和海岸沿线,分布着数量众多的航标灯.为了能及时地了解各航标灯