基于粗糙集的不完备信息系统知识约简的研究

来源 :中山大学 | 被引量 : 0次 | 上传用户:ttttt2046
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,由波兰科学家Pawlak提出的粗糙集(Rough Set)理论已成为一种重要的数据挖掘与知识获取方法。粗糙集方法是一种处理不精确、不确定或模糊知识的重要的数学工具。由于粗糙集理论是基于完备信息系统提出的,而现实生活中绝大多数信息系统都是不完备的,即信息系统中的某些对象的属性值是未知的。因此,将粗糙集应用于不完备信息系统就需要对经典粗糙集模型进行扩展。利用粗糙集的扩展模型代替经典粗糙集的等价关系模型处理不完备信息系统是现今粗糙集的研究领域之一。   本文主要研究了应用于不完备信息系统的粗糙集扩展模型及其知识约简的方法。本文的主要贡献在于研究了以下几个方面的内容:   首先,综述了粗糙集的理论研究现状,分析归纳了处理缺失数据问题的常用方法;介绍了国内外利用粗糙集处理不完备信息系统的几种扩展关系模型,其中主要有容差关系、非对称相似关系、量化容差关系、限制容差关系。   然后,在分析探讨非对称相似关系模型和限制容差关系模型的基础上,提出了一种新的扩展模型,即相似限制容差关系模型,并给出了该模型的定义,包括相似限制关系、上近似集、下近似集及相似限制容差类的定义,及其相关的性质。另外,通过理论分析和实例说明了该模型的有效性和优越性。随后,基于相似限制容差关系模型,提出了一种适用于不完备信息系统的改进的属性约简算法,即改进的属性重要度的属性约简算法,并且给出了这种方法的算法流程。   最后,设计并实现了相似限制容差关系模型,利用该模型处理了几个不完备数据集,将实验结果与用粗糙集软件—Rosetta处理的结果进行了对比分析,证明了本文提出的改进模型及约简算法能够在不影响原始数据分类效果的基础上对不完备信息系统进行有效地约简,提高了对不完备信息系统进行知识获取的整体性能及准确度。
其他文献
随着网络技术的飞速发展和网络应用范围的不断扩大,对网络的各类攻击与破坏与日俱增。在网络安全问题日益突出的今天,如何迅速有效地发现各种入侵行为,对于保证系统和网络资源的
相比于浅层网络,深度网络拥有更为有效的函数表征能力,可以为高度非线性且高度变化的函数学习到一种紧凑的表示。深度学习算法通过预训练和微调解决了深度网络的训练问题,使
在数据爆炸性增长的环境下,信息抽取成为一种从海量数据中获取有价值信息的重要手段。事件抽取是信息抽取的一个子任务,其目的是把含有事件信息的无结构化文本以结构化的形式
随着社会的发展和生活水平的提高,水资源的污染程度也成上升趋势,水污染已经成为了世界性的头号环境治理课题。我国的环保事业需要快速发展,工业废水、生活污水的处理成为当
学位
心脏病严重威胁着人类的生命,是全球范围内造成死亡的主要原因。传统的心脏病诊断方式以医生分析患者的心电图为主,医生主观判断的不确定性及心脏病病理的复杂性易造成误诊及
Skyline是指数据集中不被其他点支配的所有点的集合。支配是指在数据集中,一个数据对象的每一维值都不比另一数据对象相对应维值差,而且必须至少有一个维值比另一数据对象好。
本文提出一种基于混合图结构的图像描述与表示,并利用该结构进行图像匹配。混合图结构是图像先经预处理、分割成若干区域后,再根据图像中各区域的属性特征和空间位置关系建立
随着海洋探测与开发的不断深入,具有自主导航能力的水下航行器的需求越来越大。在复杂的水下环境中,单一的传感器设备,如声纳、摄像头等,都无法满足高精度自主导航的要求,而
随着计算机科学和信息化网络技术的发展,高性能计算机在社会各个领域发挥着日益重要的作用。高性能计算机的性能在很大程度上取决于其系统内部处理器之间的连接方式(互连网络
随着互联网时代的迅速发展,博客、微博等社交网站已经成为人们生活娱乐的一部分。人们已经习惯在这些平台上发布文章、生活信息、情感领悟等。因此,网络上迅速拥有了大量的富