基于粗糙集的决策树构造算法的研究

来源 :第六届中国Rough集与软计算学术研讨会(CRSSC2006) | 被引量 : 0次 | 上传用户:cobo520
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
决策树是一种直观的知识表示方法,由决策树导出的决策规则简单而易于理解.决策树学习目前已被作为一种重要的机器学习方法而被广泛使用,它主要用于概念学习及归纳推理.决策树学习就是一个决策树的构造过程,其基本思想为:自顶向下构造决策树,树的每个非叶结点表示一个属性,从该结点发出的每个分支对应于该属性的一个取值,这样每个样本实例根据其属性值最终在叶结点被决策树分类. 决策树分类的质量取决于叶结点的数量和叶结点的深度,根据Occam剃刀原理,生成的决策树包含的叶结点数越少且每个叶结点的深度越浅,则该决策树的质量越高.因而构造最优决策树是决策树学习算法研究的主要方向,然而这已被证明是一个NP-hard问题.本质上,构造决策树的过程就是一个选择非叶结点属性的过程.因而不同的属性选择标准构成了不同的决策树学习算法.具有较大影响的由Quinlan提出的ID3算法使用信息增益作为选择非叶结点属性的标准.ID3算法在决策树上的每个非叶结点只选择单个属性,且对属性间的相关性考虑不够,因而容易导致决策树中子树的重复和某些属性在同一决策树上被多次选择.为此,许多学者提出了不同的决策树学习算法.特别地,应用粗糙集理论构造属性选择的启发式函数来建造决策树已被许多作者所研究[6~9].本文对此进行了进一步的研究。
其他文献
本文介绍了国内废纸纤维原料的回收及废纸利用基本发展情况,并建议应努力提高国内废纸回收率和废纸利用效率,以大力促进国内废纸资源的充分回收利用。
2003年中国纸和纸板产量4300万吨,纸和纸板消费量4806万吨,均居世界第二位,仅次于美国,我国已成为纸张生产大国、消费大国,令国际纸业瞩目。根据专家预测,到2010年中国纸和纸板消费总量将达到7000~8000万吨;随着我国经济的快速发展,供给结构的变化跟不上需求的变化,我国造纸工业原料结构性矛盾日渐突出。长期以来制约造纸工业发展的因素较多,其中纤维原料结构不合理及供给不足是制约我国造纸工业
废纸回用是利国利民的事,近年来废纸回收利用的规模、数量、品种以及废纸回用技术方面均取得了引人注目的发展,但随着废纸需求量的日益增加,使低品质的混合废纸趋于增加,而社会又要求用低品质的废纸生产出高品质的纸张,这就要求人们在废纸处理技术上不断创新、改进、提高,在废纸回用中存在着最大的技术问题是纸面的尘埃、胶粘物的去除,特别是一些中小纸厂。尘埃、胶粘物的去除除了应加强筛选系统外,大量实践经验证明,其油墨
纤维在回用过程会产生不可逆的角质化。本文回顾了纤维在回用过程产生角质化的定义和相关的理论、讨论了影响二次纤维回用时的角质化作用及其影响因素。
近年来,某公司根据我国造纸工业原生纤维的发展利用受到了原料短缺、环境污染等因素的制约,许多造纸制浆企业新上或扩建了废纸处理生产线的现状,结合公司所承担的国债技改攻关项目“400t/d废箱纸板处理系统成套设备和250t/d旧新闻纸、杂志纸处理系统成套设备”,组织技术人员重点进行了大规格废纸处理设备和成套技术的开发与研制,陆续为造纸行业提供了多条废纸处理成套设备。本文就400t/d废箱纸板处理系统成套
二十世纪六十年代以来,国际上由于能源的短缺、资源的保护,废纸回收和利用受到人们的极大重视。随着人类文明的进步与发展、自然环境保护的加强以及企业节约投资、降低成本等方面的推动力,八十年代以来,废纸的回收和利用急剧增加,品种范围日益扩大,数量也大幅增加,其含有的废杂质无所不包又千变万化;而市场竞争的需求又必须用低品质的原料生产出高品质的纸张,产生供求的极大差异与特殊矛盾。九十年代以来,由于现代化的新油
本文研究了碱性生物复合酶对混合废纸的脱墨效果.研究结果表明:最佳的脱墨工艺条件为温度40℃,pH值9,复合生物酶用量约为0.04%,时间为30min.并且与化学法相比,在达到相同的脱墨效果情况下,碱性生物复合酶法脱墨具有经济成本低,脱墨废水污染负荷较小等优点。
介绍了日产400吨脱墨浆生产线工艺、设备及成浆质量,分析了影响脱墨浆生产的不利因素,并提出了相应的解决方法。
研究了美国混合办公废纸(MOW)在不同碎浆浓度以及在碎浆时加入脱墨化学品对浮选脱墨的影响,并对实验室浮选操作条件和脱墨化学品的匹配及其用量进行了探讨。结果表明:在碎浆时加入脱墨化学品对提高白度和脱墨效率很重要,在优化的碎浆和浮选条件下,MOW脱墨浆白度由未浮选的71.5%ISO提高到77.3%ISO,残余油墨量由未浮选的24.94 mm2/g浆减少到0.39 mm2/g浆,浆中灰分降低81.2%,
自模糊集提出以来,许多的模糊推理方法被提出作为模糊环境下推理的数学工具.众所周知,模糊推理已成为了理论基础,以及设计模糊控制器的重要工具,并在工业某些领域应用中取得了成功,如智能控制.尽管如此,模糊逻辑的数学基础仍然有许多严重的问题需要解决,这导致了一些深入研究.其中的一个问题就是模糊蕴涵式的选择,因为蕴涵是任何逻辑系统里的主要连接,它对模糊逻辑应用的系统的运行强大的影响.Zadeh,Mamdan