基因表达谱的非参缺失森林填补算法研究

来源 :中国卫生统计 | 被引量 : 0次 | 上传用户:liongliong507
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目的评估不同基因表达谱数据集下,多种算法在缺失数据中的填补效果,并分析其对无监督基因表达谱聚类的影响。方法在不同缺失比例的情况下,分别采用非参缺失森林填补法、贝叶斯线性回归法、蒙特卡洛多重填补法和K邻近填补法进行填补,通过均方根误差(NRMSE)和聚类准确率(F值)两个指标来评估不同方法的填补效能和聚类效果,并用模拟数据集进行测试和乳腺癌数据集进行验证。结果随着缺失比例的增加,四种填补方法的NRMSE都逐渐上升;任意缺失比例下,相比于其他三种方法非参缺失森林填补法的填补优势明显。缺失比例为5%、10%、2
其他文献
p-maxian问题是在拥有n个demand点的网络中安置p个设施,使得所有demand点到最远设施的赋权距离之和达到最大。在本篇论文中,我们主要讨论在赋权圈上限制的2.maxian问题,并给出O(n^
教育部和财政部已正式启动“国家示范性高等职业院校建设计划”,高职院校应全面推进素质教育,积极创新人才培养模式,在实训基地建设、示范专业与精品课程建设、高水平双师素质师
目的分析肿瘤病人的住院费用,以期为卫生决策部门和医疗机构提供数据决策支持。方法对某院2011-2013年间出院的肿瘤病人住院费用的影响因素进行分析。结果肿瘤病人费用中以西
一种新型的智能液位计采用以单片机为控制核心的螺母丝杆固联高精度差压传感器的检测方法,可提高储罐液位检测的精度。
王圣宝先生的专著《文化源流论》,从历史生物学的角度,对文化源流问题进行探讨,提出自己独到的见解。由于从全新的角度研究问题,所以书中新论频出,而成一家之言。
目的探讨分析具有相关关系的二分类资料的有效处理方法。方法采用蒙特卡罗模拟比较广义估计方程和广义随机效应模型与一般logistic回归在处理具有相关关系的二分类资料的区别