概念的不确定性度量及在知识获取中的应用

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:com_cn121
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
粗糙集理论是一种处理不确定、不精确、不完整信息的有力工具,它无需先验知识,能够直接对数据信息进行分析和处理,并发现潜在的知识,现已成功应用于机器学习、数据挖掘、决策支持与分析、不确定推理和软计算等领域。对于粗糙集理论,不确定性主要来自不可分辨关系和粗糙集的近似域,当近似域中的上、下近似集不相等时,其边界域不为空,此时概念存在不确定性。在粗糙集不确定性度量中,概念的不确定性度量反映了给定近似空间对概念的近似能力,主要的度量方法有粗糙度、粗糙熵、模糊度和模糊熵等。信息系统的属性约简和规则提取是知识发现的两个重要问题,启发式属性约简是常用的约简方法,而不确定性度量方法为设计启发式属性约简算法提供了理论依据,度量方式的不同会直接影响属性的搜索策略,得到不同的约简结果;同时,度量方式的优劣也直接影响了规则提取的好坏。本文在概念不确定性度量方法和基于粗糙集知识获取的基础上,主要在以下几个方面进行研究和探索,并取得相关研究成果:(1)分析了粗糙集的模糊度在不同知识粒度下的变化规律,证明了该模糊度随着知识粒度的减小而单调递减,并讨论了模糊度随知识粒度细分的性质。这种模糊度在不同知识粒度下的变化规律,对用不确定性度量方法来设计启发式的知识获取提供了理论的依据。(2)在决策信息系统中,结合模糊度的性质,给出了修正条件信息熵和相对模糊熵的定义。用两种不同的方法证明了这两种熵在属性约简中的单调性,利用熵作为启发式属性约简方法进行属性约简。通过实验对比分析了利用各种熵进行属性约简的结果,以及它们在各种分类算法中的分类精度。结合相对模糊熵的相关性质,重新定义了一种新的属性重要度,得到了属性较少的约简结果。同时,给出了决策模糊熵的定义,并用于构建决策树来进行规则提取,得到了较为简化的决策规则。(3)在研究粗糙集近似集的基础上,结合概念不确定性的度量新方式,提出了一种应用于不一致决策信息系统的规则提取方法,得到的规则简洁合理。同时,在决策信息系统中给出了相对近似度的概念,很好地体现了条件属性对论域形成的划分空间与决策属性对论域形成的划分空间之间的相似度,并提出了基于粗糙集近似集的属性约简算法。实验结果表明,用该方法约简得到的属性在各种分类算法中有较好的分类特性。
其他文献
目的:本研究通过热奄包穴位热敷联合生物反馈疗法治疗气滞血瘀型功能性肛门直肠痛的患者,观察此方法治疗该病的临床疗效及安全性,探讨其作用机理,为临床应用提供新的治疗方法及相应的理论依据。方法:本研究将2018年9月—2019年10月在石家庄市中医院肛肠科诊治的符合纳入标准的60例签署知情同意书的患者采用随机数字表法分为两组,治疗组30例采用热奄包穴位热敷联合生物反馈疗法进行治疗,对照组30例采用生物反
目的:探讨急性心肌梗死患者经皮冠状动脉介入治疗(Percutaneous Coronary Intervention,PCI)植入药物洗脱支架(Drug Eluting Stent,DES)后早期支架内血栓(Early Stent Thrombosis,EST)形成的危险因素,以早期识别高危患者并减少该并发症的发生。方法:回顾性分析2013年至2017年天津市胸科医院CCU收治的已行PCI植入药物
油菜素类固醇(brassinosteroids, BRs)是一类新发现非传统的植物激素,在植物生长和发育过程中起非常重要的作用。CPD和DWF4是最早在拟南芥中发现的编码关键BR生物合成酶的基
目的:通过观察膏摩治疗乳痈初期(气滞热壅型)的临床疗效,研究膏摩对乳痈初期主要症状的改善情况,从而能够更好的指导临床,达到精准治疗的目的。方法:将符合纳入标准的62例乳痈初期(气滞热壅型)观察对象按照随机数字法平均分为膏摩组(观察组)和推拿组(对照组)进行观察,每组各31例。分别于治疗前、治疗3天后,记录乳痈初期中医证候量表、乳痈初期主要单项症状评价量表和VAS(Visual Analogue S
养老金亏空的问题在我国日益严峻,为了缓解这一现状,2015年国家鼓励养老金入市以保值增值,但是其投资收益并不乐观,且入市的金额远低于预期,这不仅会给国家造成沉重的经济负担,老年人的生活也无法保障。其主要原因就是在我国金融市场上鲜有与养老金投资需求相匹配的金融产品,因此本文拟设计出一款收益稳定,风险等级较低的养老型FOF基金产品——稳健收益型养老FOF基金,从而缓解养老金亏空压力,同时对我国基金市场
带式输送机是现代最重要的散装物料运输设备之一,它广泛应用于电力、冶金、化工、煤炭、矿山、港口、建材、粮食等领域。滚筒作为带式输送机的主要受力部件,严重影响着带式输送机的运行状况。建立正确的驱动滚筒受力模型,对进行下一步结构优化、失效分析起到关键作用,搭建实验平台进行实验验证是确保受力模型正确的必要手段。驱动滚筒失效的原因很多,其中一个重要原因是焊缝开裂引起的滚筒断裂失效。因此,工作状态下驱动滚筒的
我国高炉炼铁的大多数炉料结构以高碱度烧结矿为主,因此,烧结矿质量对高炉生产有着重要影响,很大程度上受限于烧结工艺所使用的铁矿石原料。钢铁行业是我国作为制造业的第一大产业,也是国民经济的支柱性产业,市场竞争和钢铁生产规模的扩大,促使各个钢铁企业千方百计降低生铁成本,其中降低烧结配矿成本是首选措施之一,使用低价矿替代高价矿是必然的发展趋势。褐铁矿价格比赤铁矿较低,在不影响烧结矿质量的前提下,在烧结矿中
在物理学、化学、生物学、经济学及各种工程问题中提出的大量反应扩散问题,日益受到人们的重视。本文主要讨论了一维反应扩散方程的推导,二维方程讨论了Hopf分支以及分支周期
矩阵优化问题(Matrix Optimization Problems)可分为变量为矩阵的优化问题(或称矩阵函数极值问题)和矩阵值函数极小化问题(或称为函数矩阵极值问题)。关于变量为矩阵的优化问
近来,猪已经被作为研究人类疾病和干细胞治疗等的一种重要的动物模型。而猪孤雌胚胎由于有着无需受精且不违背伦理道德的优势,受到了人们的广泛关注。但是通过研究,人们发现猪的