【摘 要】
:
为处理随微阵列技术发展而急剧增长的肿瘤基因数据,实现对肿瘤基因数据的特征选择,结合集成特征选择和混合特征选择,提出一种Spark分布式计算框架的混合特征选择方法。利用F-
【机 构】
:
上海大学机电工程与自动化学院,上海市电站自动化技术重点实验室
【基金项目】
:
上海市科委重点项目(14DZ1206302)
论文部分内容阅读
为处理随微阵列技术发展而急剧增长的肿瘤基因数据,实现对肿瘤基因数据的特征选择,结合集成特征选择和混合特征选择,提出一种Spark分布式计算框架的混合特征选择方法。利用F-score特征选择方法去除无关特征,进行初步特征选择,结合F-score、多分类支持向量机递归消除法、基于随机森林的特征选择3种方法得到最优的特征子集,并采用支持向量机对特征子集进行分类预测。实验结果表明,该方法能通过选择较少的基因达到较高的分类准确率。
其他文献
本文分析了股权结构与公司绩效间存在的相关关系,通过选取多个公司绩效评价指标,构建了一个能够对多个股权结构变量进行分析的回归模型。
乡镇(街道)工会作为地方级别的行政管理部门,其主要职责是:积极组织广大工会会员进行思想道德、行为规范、文化艺术、群众体育教育以及技能培训,组织开展惠民活动,有效维护人民群众
随着计算机技术和测试技术的突飞猛进,起重机的动力学分析得到了很大的发展,主要表现在如下几个方面:(1)数值分析方法取得巨大发展,许多过去根本无法计算的复杂的结构动力问题现在
目前认为导致老年人轻度认知功能障碍(MCI)的影响因素很多,血管性危险因素以及年龄、性别、教育水平等均与认知损伤有关。如何客观评价MCI的诊断、记忆和认知功能障碍的特征,是亟