具有高可理解性的二分决策树生成算法研究

来源 :软件学报 | 被引量 : 0次 | 上传用户:lujunjun_1204
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
二分离散化是决策树生成中处理连续属性最常用的方法,对于连续属性较多的问题,生成的决策树庞大,知识表示难以理解.针对两类分类问题,提出一种基于属性变换的多区间离散化方法--RCAT,该方法首先将连续属性转化为某类别的概率属性,此概率属性的二分法结果对应于原连续属性的多区间划分,然后对这些区间的边缘进行优化,获得原连续属性的信息熵增益,最后采用悲观剪枝与无损合并剪枝技术对RCAT决策树进行简化.对多个领域的数据集进行实验,结果表明:对比二分离散化,RCAT算法的执行效率高,生成的决策树在保持分类精度的同时,树
其他文献
流程的分布性要求工作流模型中时间约束可以采用不同的时间粒度来度量.为此,定义了工作流模型MG-TWF.通过多粒度相对时间约束、多粒度绝对时间约束及多粒度时间约束工作流网
【正】 发现攻击今天发现老是有人连接我的计算机,防火墙总是闪个不停。打开防火墙的日志文件一看,发现如下的连接请求: [11:15:50]从10.X.X.X:3342接收TCP数据包,对应的本机
近年来,随着交通事故、刑事案件、工程事故逐渐增多,胸腹部创伤亦成倍增长,其中创伤性膈肌破裂及膈疝是胸、腹部创伤中一种严重的合并损伤.发生率占胸腹创伤的2.3%~6.7%。1990--2005年
时下,液晶显示器的市场十分火爆,这里的原因除了液晶产品自身环保健康的优势之外,价格的不断下降也是不容忽视的。目前,主流的15英寸液晶已经降到了2000元以下,不少17英寸的
在片上系统(SOC)的设计中,常常需要把某些单元摆放在某一预定坐标线附近相对较小的区域内.这一约束的来源是,在总线结构中,通过总线传递的数据,应当同步地出现在总线上,不能
【正】 本周IT“静悄悄”,因为全球所有的人,都在关心目前正在进行的这场美伊战争。编辑部里也是天天有“评议”,这场战争能打多久?今天的战局有什么变化?等等。笔者也是破天
1 病历报告患者,女,30岁,汉族,孕37周。主诉:右下颌牙龈反复大出血2d。现病史:2d来,右下颌牙龈反复大出血,呈喷射状,在当地医院止血无效来我院急诊。在门诊行缝合及用明胶海绵、碘仿油
遥望,当年第一款MMORPG网络游戏《万王之王》风靡中国市场时,玩家热情高涨,激情飞扬的场景还历历在目,至今仍有许多玩家念念不忘当年在《万王》中创造的辉煌。如今,有数款曾
【正】 内测的时候,我的第一张卡片就是在地煞洞打到的,所以从那个时间我就认定地煞洞是自己练级的福地。后来发现,地煞洞适合各个职业的玩家,对所有人来讲都是练级打宝的圣
以pBV220为载体,进行了合成可溶型人干细胞因子(SCF)cDNA在大肠杆菌中的温控型的高效表达.SDS-PAGE检测表明,在实验室摇瓶培养中,目的蛋白可占菌体可溶蛋白的40%左右.表达产