【摘 要】
:
粗糙集理论是一种新的处理模糊和不精确问题的重要数学工具,由荷兰学者PawlalkZ于1982年提出的。它不依赖于数据集之外的附加信息,是处理含有噪声、不精确、不完整数据的有力
论文部分内容阅读
粗糙集理论是一种新的处理模糊和不精确问题的重要数学工具,由荷兰学者PawlalkZ于1982年提出的。它不依赖于数据集之外的附加信息,是处理含有噪声、不精确、不完整数据的有力工具,是一种新的数据挖掘技术。基于粗糙集理论的数据挖掘过程主要分为数据预处理、属性约简、规则生成和决策支持四个步骤。本文研究了属性约简的相关算法,并探讨了数据预处理过程中的连续属性离散化问题。属性约简是利用粗糙集理论进行数据挖掘中最重要的一个环节,它分为前向选择法和后向删除法两大类,其中前者主要基于属性核的结果,因此本文着重研究了求核算法。当决策表中存在大量冗余或不相容数据时,以往的求核算法,虽然既可以处理相容数据,又可以有效得到不相容数据的求核结果,但它们采用或者保留冲突数据的方法计算,或者直接删除冗余与冲突数据进行处理,而忽略了其内在隐含的信息。本文给出了一种加权求核算法,能够根据冗余或不相容的程度体现出数据的参考价值和结果的可靠性,并已通过实验证实,所得结果更接近于实际情况,弥补了仅仅从算法角度求核的不足。连续属性离散化是数据挖掘过程中的前期工作,本文介绍了几种离散化思想,并讨论了传统的基于属性重要性离散化方法和结合微粒群理论进行离散化处理的过程,为本文的国民经济动员潜力分析系统连续属性离散化处理提供理论指导。最后,以蘑菇数据库为例进行实验,得到影响蘑菇毒性的属性及规则,证实了粗糙集理论在数据挖掘过程中的有效性。由于蘑菇数据库与本文的国民经济动员潜力分析系统的数据相似性,从而,尝试性应用于后者,达到国民经济动员的目的。
其他文献
SOA对现代软件开发模式产生了深远的影响,它通过服务的发布、发现以及绑定等机制为其他的应用程序提供服务。SOA具有松散耦合、粗粒度、互操作性等优点。通过采用SOA架构的设
近年来,足球视频的检索与摘要技术发展越来越迅速,作为足球视频检索与摘要关键技术之一的精彩镜头提取技术也引起了国内外诸多学者的关注。现有足球视频精彩镜头的提取方法主要
随着网络信息量成爆炸式地增长,人们要在信息海洋中找寻自己需要的信息是十分困难的。因此,随之出现的信息检索系统------搜索引擎成为人们搜索信息的主要工具。虽然搜索引擎
对象存储系统是一种新的网络存储体系结构,它结合了存储区域网的高性能和网络附加存储的跨平台的优点。对象存储控制器是对象存储系统的关键部件之一。利用SOPC(System On Pr
本论文的研究工作主要是基于计算机符号计算技术,并结合微分方程、代数及算子等相关数学理论,跨学科地研究了现代科技中一些重要的非线性数学模型。这些模型的应用涉及到光孤子
在企业流程管理生命周期中,建立合理的管理模式是非常关键的,但单一的建模方式并不能完全满足企业的要求,这就需要一种以业务流程为主体,知识流为辅的方式来进行集成建模,使
文字知识库是文字书写自动教学系统的必备教学资源,目前单一文种知识库技术已相当成熟,当今社会更趋多元化,文化相互融合更加紧密,为适应此需求,文字书写自动教学系统应具有
随着因特网商业化革命和网络融合技术的不断发展,基于电路交换的公共交换电话网(PSTN)逐步被基于分组交换的下一代网络(NGN)替代。软交换作为NGN网络的核心单元,它整合了语音
随着我国信息化前进的步伐以及互联网技术的迅速发展,随着国家“信息化带动工业化,政府先行”大政方针的指定,电子政务成为近几年信息化研发的热点。而在开发的大量的电子政
网页自动文本分类是处理和组织大规模网络文本信息的关键技术,是使信息资源得以合理有效组织的重要方法,同时也是解决主题搜索、个性化信息检索、搜索引擎的目录导航、信息过