【摘 要】
:
Cox比例风险模型能够分析生存时间对协变量的依赖关系,由于该模型可以分析包含删失样本的生存资料,在一定程度上缓解了样本不足的问题,且不要求估计资料的生存分布类型,因此是生存分析领域应用最广泛的模型之一。选择与存活表型相关的预后基因是生存分析研究的重要课题。为了解决基因表达谱的高维度和共线性问题,常用的方法是使用?_1范数估计,因此Cox模型的改进算法Lasso-Cox模型是有效的解决方案。基于稀疏
论文部分内容阅读
Cox比例风险模型能够分析生存时间对协变量的依赖关系,由于该模型可以分析包含删失样本的生存资料,在一定程度上缓解了样本不足的问题,且不要求估计资料的生存分布类型,因此是生存分析领域应用最广泛的模型之一。选择与存活表型相关的预后基因是生存分析研究的重要课题。为了解决基因表达谱的高维度和共线性问题,常用的方法是使用?1范数估计,因此Cox模型的改进算法Lasso-Cox模型是有效的解决方案。基于稀疏回归算法,Lasso-Cox模型的正则化参数必须通过交叉验证仔细调整以优化性能,这通常会消耗大量的计算资源。本文提出一种数据驱动的稀疏回归算法(Bayesian-Lasso),采用贝叶斯方法从数据中自动学习正则化参数,并利用交替迭代的方法求解回归系数。模拟实验结果表明,与传统的Lasso方法相比,Bayesian-Lasso方法在预测性能方面具有很强的竞争力,模型更稳定,计算时间更短。真实基因数据实验表明,该算法选择的预后基因与表型密切相关,可以用于高维基因表达谱预后预测模型的建立。由于不同疾病之间可能存在内在联系,因此相关的生存预测模型很普遍,这涉及多任务生存分析问题。另外,在实践中获得足够的标记训练实例用于学习稳健的预测模型可能是非常困难的。针对上述问题,本文提出了一种基于Cox模型的多任务学习方法(MT-Cox),其使用?2,1范数来鼓励多个预测变量共享相似的稀疏模式,考虑不同任务之间的相关性并增加用于训练每个任务的信息,从而提高预测性能。为了提高模型稳定性并加速计算,同样采用贝叶斯方法和交替迭代方法求解参数。实验部分在癌症基因组图谱(TCGA)数据集上证明本文所提出的多任务学习方法的性能,结果表明与其他相关的竞争方法相比,该方法可以显著提高模型的预测性能。
其他文献
婴幼儿肺炎为儿科常见疾病,我院近4年来,采用细辛脑针剂静滴治疗婴幼儿肺炎,疗效满意,但也出现一些不良反应,现报道30例如下。
目的:探讨CD44、CD133在胃癌组织中的表达情况及与各临床病理参数的关系。分析二者的表达是否具有相关性,进而发现二者的表达程度与胃癌分期的相关性。以期能为临床指导治疗
<正> 发育中的卵子和受精卵受多种蛋白的影响,基础成纤维细胞生长因子(FGF)是其中重要的一种。基础FGF促进多种细胞包括胚胎细胞的生长和分化,也会影响卵泡的发育。本文研究F
随着新高考改革的推进,生涯教育如雨后春笋般铺天盖地地蔓延开来。它与素质教育、德育、心理健康教育实则有异曲同工之妙、殊途同归之实,它既是这些课程的综合,也是能将这些
农村土地"三权"分置是由实践问题引发的诱致性制度变迁到国家自上而下的强制性制度规范的过程。2019年中央一号文件明确要求完善农村土地"三权"分置的政策体系。这就需要结合
本文阐述了目前世界上甜味剂的品种、生产、消费情况以及发展趋势,并就我国甜味剂的发展提出了几点个人看法。
所谓“新乡贤”,是指在当前社会发展中,那些从农村地区脱颖而出,具有一定社会影响力、具备良好道德和高尚情怀,且愿意积极投入到家乡的建设,能够为农村地区现代化建设贡献自
详述了酒泉市肃州区甜菊生产现状、存在的问题、发展对策、发展前景,并对产量效益和生产典型做了总结。
最近几年,随着国家对"全民阅读"的重视,与阅读有关的活动和组织,越来越多地出现在生活中。人们一方面意识到阅读的重要性,一方面也意识到在信息爆炸、信息碎片化的互联网时代
目的 探索在《护理伦理学》课程中引入基于本科护生学习力的翻转课堂设计的教学效果,以期为护生伦理思维的培养及学习力的提高提供参考依据.方法 将《护理伦理学》课程中的科