基于改进信息熵离散化的决策树算法研究

被引量 : 0次 | 上传用户:lovele
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在解决分类问题的各种方法中,决策树方法是运用最广泛的一种。但是由于C4.5算法的对连续属性进行离散化处理时易出现的一些问题,即基于熵的离散化算法(EBD),致使不具备较好的易操作性。针对此问题,在博弈演化思想的启发下,对EBD算法进行了改进,提出了基于博弈论的离散化算法,即将离散化过程视作博弈演化的过程,经过不断的演化达到较为满意的均衡解,并根据实际问题适当的优化算法的计算复杂性,使其较为实用。离散化过程中所建立的博弈模型,其纯策略nash均衡,即为离散化的全局最优解,对于求解过程,第四章提出了一种新的搜索策略。其特点在于一是在遍历开始之前选择较优的遍历策略,二是通过遍历过程得到的信息来动态调整遍历策略空间,三是尽可能缩小遍历空间。这样在求解nash均衡时会降低系统的时间开销。为了尽可能减少算法的计算量,本文对算法进行了一定的优化,并进行了实验验证。由于并非所有的离散化所转化的博弈模型都存在全局nash均衡解,为了防止博弈演化进入无限循环,要根据情况定义演化的停止准则,同时对离散化的结果进行初步评估,从而获得较为满意的结果,为分类算法提供高质量的数据基础。本文实验分两个部分,其一是将所提的nash均衡求解算法,与几个经典的求解算法进行对比,说明该算法具有较好的收敛效果;其二是将本文提出的离散化的算法与EBD算法进行多方面对比,说明该算法具有较好的有效性。实验结果表明,与EBD算法相比,改进后的算法不仅保持简单性、一致性和精确性,而且容易操作。
其他文献
介绍了顶管机孔型设计和机架优化排列设计的实用程序公式。对φ133mm顶管机进行合理的孔型设计和机架优化排列,开发出φ159mm孔型。
为增进铁路行车安全,提高列车行车密度,运用号志及行控设备,以集中控管列车的运行秩序,为维护铁路运转安全的必要手段。随着信息技术的迅速发展,铁路安全行车也大量应用了这一技术
翻译学的学科建设是贯穿翻译研究始终的理论目标,翻译学的社会学视角是统摄整个翻译研究学术思想的理论主线。翻译学文化与社会学视角研究的合理性与局限性使其最终发展成为
目的调查中医护理技术的临床应用。方法自2010年1~12月,针对我市内37个综合性医疗单位进行基层医院,组成调研小组,结合与中医专家访谈,自制调研问卷,对医疗单位的中医护理情况
目的探析中医治疗颈椎病的临床效果。方法搜集2013年8月~2014年8月我院接收的颈椎病94例患者,按照就诊日期单双号分为实验组与对照组。对实验组47例进行中医治疗,对照组47例
针对有机硅流化床反应器中两种主要的导热油管路——指形管和U形管,从传热管结构、传热性能和传热特性3个方面进行了对比。相比于指形管,U形管导热油管路可获得更好的总传热
运动员专项智力与运动员的心理选材、训练以及比赛的运动表现关系相当密切,对其研究具备理论意义和实践价值。但目前研究方法存在诸多不足,多采用传统智力测验方法对一般智力
本文在分析国内外关于债务期限结构对企业投资行为影响的基础上,构建了以资本结构、现金流量比率、成长机会、滞后投资为控制变量,研究债务期限结构与投资相关关系的固定效应
骨折病人治疗的最终目的是促进骨折愈合,使病人尽早、最大限度地恢复肢体功能。因此,及时有效的功能锻炼不仅是骨折治疗的重要原则之一,也是护理工作的重要内容。本文通过对
目前在我国大量的医疗纠纷中,一半以上不是由技术问题引起的,而是由于医患双方缺乏沟通理解所导致的。提高医生情商是减少医疗纠纷的方法,提高医生的沟通能力,使医患双方能良