基于粗糙集理论的增量算法的研究和应用

来源 :福州大学 | 被引量 : 3次 | 上传用户:BBQChris
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数据库技术的发展和应用,社会各部门积累了大量的数据,而且这些数据每一天都在增加。数据挖掘是发现这些数据背后隐藏的知识的有效手段,但是,如果在数据库更新之后都要对全部数据进行重新挖掘,需要消耗大量的资源,这导致对增量挖掘算法的迫切需求。把增量算法与数据库的更新结合在一起,渐增地进行知识的更新、修正和加强先前业已发现的知识,这样可以不必重新挖掘全部数据。粗糙集理论是数据挖掘的方法之一,它是处理模糊和不确定知识的一种数学工具, 已在人工智能与知识发现, 模式识别与分类, 故障检测等方面得到了较好应用。但是,目前基于粗糙集理论提出的数据挖掘算法主要都是针对静态数据集。考虑到实际应用的需求和粗糙集理论的现状,本文主要对粗糙集理论的增量算法进行研究。首先,介绍了两种典型的粗糙集理论的增量算法,分析其中的优点和缺点,指出了他们所存在的理论上的缺陷。然后,通过对ASRAI算法的介绍与分析,举出ASRAI算法的反例,提出增量算法1以用于克服ASRAI算法存在的缺点。实例结果表明它可以有效地处理本文中提出的反例。最后,引入了Shan算法,经分析表明Shan算法与ASRAI算法是等价的。通过对Shan算法的研究发现:当添加某一类新记录时,运用Shan算法得出的结果可能出错,而且这种错误是无法克服的,只能运用静态算法对数据集进行重新计算。通过以上的分析表明增量算法1只能处理部分的反例,为此提出了增量算法2,实验结果表明改进效果良好。与此同时开发了一套粗糙集理论的系统原型,包含了部分的粗糙集理论的算法,并对本文提出的增量算法2进行了实验分析。
其他文献
软件工程是为了经济地获得可靠的和能在实际机器上高效运行的软件而建立和使用的好的工程原则.将工程学的科学方法植于企业应用系统的开发过程,由此所产生的一系列的概念、过
椭圆曲线密码体制是一种基于代数曲线的公开密钥体制.使用椭圆曲线作为公钥密码体制的基础是由于定义在有限域上的椭圆曲线上的点的集合可构成阿贝尔群,由此可以定义其上的离
该文实现的小波图像压缩系统具有较好的压缩性能,能够应用于包括数学图书馆在内的很多领域,是一种通用的静态图像压缩系统.首先,该系统压缩的结果是嵌入式码流,允许从有损到
现今互联网正日益高速发展,当前的网络架构逐渐遇到发展瓶颈。尤其是随着网络虚拟化、云计算的大规模兴起,现存的网络设备及相关协议正成为阻碍其发展的因素。由于网络流量达
该文主要讨论工商行政管理中的信息技术应用,重点研究了计算机网络的全省架构、数据库系统的总体架构和业务应用软件系统的设计方案.在网络架构中主要讨论了建立覆盖省、市、
ARM是32位嵌入式RISC微处理器,目前占据低功耗、低成本和高性能的嵌入式系统应用领域的领先地位.虚拟机是用软件实现的机器.ARM虚拟机则是ARM微处理器的软件实现,其主要功能
该论文的主题是短信息点播管理服务器的设计与实现.该论文先介绍了短信息服务以及短信息点播服务的发展,提出了对短信息点播服务进行管理的必要性,进而引出短信息点播管理服
目前在Internet网络给人们带来极大方便的同时,人们已不再满足于从Internet上查询一般的信息,更需要从专业信息系统中获取全面、准确、及时的信息.这时就要考虑到Internet上
论文中的重点工作包括:①如何根据新图比例尺确定原图各地物要素的数量选取指标是实现无级比例尺数据处理的基础和关键.在开方根模型和等比数列模型的基础上,根据中国常见比
数据挖掘是数据库系统和新的数据库应用的一个学科前沿.属性约简则是数据挖掘预处理中非常重要的一步,它大量压缩了信息系统的大小,有效提高了规则发现的准确性和效率.属性约