改进决策树算法在肿瘤数据中的应用

来源 :东北师范大学 | 被引量 : 2次 | 上传用户:lxw19831201
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
于1990年正式启动的人类基因组计划到2003年美国人类基因组项目负责人Francis S.Collins博士宣布人类基因组序列图制作成功,人类基因组所有研究目标全部完成,从此生物信息学步入了后基因组时代,在这过去的20年里获得的大量基因表达数据呈爆炸性趋势增长,而且基因数据又具有高维度,低样本的特性,使得在海量基因数据中寻找关于疾病的基因成为挑战,这就决定了特征选择在生物信息学中的非凡意义。本文主要研究对二叉决策树进行改进的算法,提出一种全新的二叉决策树分类算法,具体如下:结合决策树的ID3(Iterative Di-chotomiser)、C4.5和CART(Classification and Regression Trees)算法,提出改进的二叉决策树分类算法(Improved Binary Decision Tree Classification Algorithm,IBDTCA)。并且为数据实验结果更加准确,我们还对决策树进行了剪枝,提出剪枝二叉决策树分类算法(Pruning a Binary Decision Tree Classification Algorithm,PBDTCA)。
其他文献
7月30日,《浏阳日报》头版头条以“‘人民功臣’甘厚美”为题,首发报道退役军人甘厚美典型事迹。报道刊发后,引起广泛关注,社会各界对甘厚美先进事迹给予高度赞扬。作为最基
采用"有无对比法",即将建设本项目所产生的效益和费用与未建设本项目所产生的效益和费用进行对比,来定量分析现代有轨电车项目实施前后所带来的经济效益和社会效益,并以某市
结合葠窝水库特点与实际,构建了水库安全鉴定评价指标体系,提出了指标权重、计算方法、评价标准,采用层次分析法对葠窝水库进行了安全综合评价。根据评价结果,从运行管理、防
目的探讨灵芝多糖肽在胶质瘤的治疗作用,为脑胶质瘤的治疗提供新的治疗手段,并且探索灵芝多糖肽治疗胶质瘤的作用机制。方法本实验分体内和体外研究进行。体内研究是先建立Fi
二十世纪,各民族在地域性中形成的传统色彩艺术已经融合成为反映人类当代色彩本质丰富性的世界色彩文化;而当代色彩艺术的时代性和世界性又反过来改变着民族区域色彩的传统和
随着社会经济的不断发展,对于电力资源的需求也越来越大,这在很大程度上也促使电力企业必须在技术上要不断的创新,以寻求最大化的效率的提高。本文将详细对智能化抄表管理系
图4是北京市76住1-改通用住宅设计中的一单元二室户的家具布置平面设计图,适合夫妇二人及大儿、大女二代人居住,供读者参考。在一个10多平方米的房间内布置了两个单人床,为
背景:慢性髓细胞白血病(CML)简称慢粒,为恶性血液系统疾病,发生于骨髓造血干细胞,病程分为慢性期(CP)、加速期(AP)、最终急变期(BP/BC)。加速期、急变期被认为是疾病进展期,本病中位发病年
阜阳市颍州南路与京九铁路立交桥工程位于颖南站南端咽喉区,规划颍州南路、润河路在此处均与铁路立交。重点探讨立交方案比较情况,并着重阐述下穿框架设计中的关键问题及解决
在分析我国慈善组织发展及财务信息披露方面存在的问题的基础上,提出了完善慈善组织财务信息披露的具体对策。