Lasso方法和贝叶斯集成方法在乳腺癌的基因表达方面的生存分析

来源 :山西医科大学 | 被引量 : 4次 | 上传用户：wac725725

【摘要】

：

高维度、相关小样本的基因表达生存数据在医学分析中越来越常见。一般的生存分析方法（COX比例风险模型、加速失效时间模型等）在分析基因微阵列时，遇到样本量小、自变量多时，不能

【作者】

：

胡晓娟

【出处】

：

山西医科大学

【发表日期】

：

2014年01期

【关键词】

：

贝叶斯 Lasso 贝叶斯集成乳腺癌数据

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

高维度、相关小样本的基因表达生存数据在医学分析中越来越常见。一般的生存分析方法（COX比例风险模型、加速失效时间模型等）在分析基因微阵列时，遇到样本量小、自变量多时，不能直接应用得到临床结果和预测。不管样本量大或者样本小，如果样本本身具有高维性，在进行变量选择时，一般统计分析方法的使用可能容易出现计算难度大或者过度拟合这样的问题，为此本文采用一种改进的Lasso和贝叶斯集成方法来解决这个难题。Lasso (The Least Absolute Shrinkage and Selectionator operator)由Tibshirani在1996年提出的一种新型算术方法。这种算法通过构造一个惩罚函数获得一个精炼的模型，把一些没有意义或意义很小的变量系数压缩为0之后，得到的模型反而更优[1]。为了获得拟合结果比较好的模型，在系数绝对值上添加一个约束条件来达到对高维资料进行降维的目的，这样的做法更适合于基因数据的生存分析。尽管lasso方法在解决高维问题方面取得了一些成果，可是在分析共线性数据时，它是一种有偏估计。例如在分析基因表达数据时并没有考虑到基因间复杂的相互作用关系。Lee和Mallick在2004年把集成方法（bagging、boosting和random forests等方法）对于变量选择发展应用到Cox比例风险模型中，在分析高维数据时很好地综合了变量之间的相互作用。本文采用贝叶斯集成方法分析乳腺癌基因表达数据，是基于“sum-of-trees”模型(Chipman et al,2010)。在Cox比例风险模型中通过完全贝叶斯分层方法估算的不确定性，对每个阶段传播的层次结构进行预测[2]。这种方法有效地克服了缺乏共轭性引起的分析误差，通过使用一个潜变量公式来模拟协变量。这样不仅允许随机偏差，而且提高计算效率、方便快捷[3]。本文在分析高维生存数据（基因表达数据）采用Lasso和贝叶斯集成方法。通过Van tVeer(2002)的乳腺癌基因表达数据，研究乳腺癌是否发生远端转移与检测到的300个基因的关系，采用Lasso方法进行变量选择筛选出15个有意义的基因，而采用贝叶斯集成方法进行变量选择筛选出8个有意义的基因，但是Lasso方法在BS、R2、CI三方面的性能估计低于贝叶斯集成方法。原因在于贝叶斯集成方法使用贝叶斯累加回归树（Bayesian additive regression trees,BART）,通过一个潜变量模拟协变量效应,不仅允许随机偏差模型,还大大降低了计算复杂度，提高了性能估计。本文对乳腺癌基因表达数据的分析采取软件R[4]编程来实现。

其他文献

高校研究生常见心理问题及干预对策

心理素质是当前研究生培养过程中极为重要的内容,受环境和自身因素的影响,研究生容易在人际交往、学业适应、自我认知、自我发展、恋爱情感等方面出现各种心理问题,正确审视

期刊

研究生心理困扰干预对策

在小学语文教学中如何有效利用乡土资源

【摘要】　　将乡土资源与学科教学有机的结合起来，一直是教学工作者探寻的目标。在小学语文教学中充分运用乡土资源，能够在传授知识的同时，将生活传递给学生，调动学生的学习积极性，对于基础人文学科的语文学科学习至关重要。合理引入乡土资源，需要与教材相结合，在实践中不断进行探索，实现乡土资源与语文教学的内在契合，最终实现教学的全面发展。　　【关键词】　　小学语文教学乡土资源教材　　小学语文教学是一门重

期刊

小学语文教学乡土资源教材

双胎之一合并重型β-地中海贫血的选择性终止妊娠1例

<正>1病例报告患者,31岁,双胎妊娠,孕25+4周,因要求行胎儿选择性终止妊娠于2016年4月5日由外院转入本院。患者平素月经规律,无痛经,G2P1,本次系自然妊娠。孕12周外院建卡定期

期刊

重型β-地中海贫血终止妊娠地中海贫血基因胎盘位置减胎术羊水穿刺

论中国电视批评的可持续发展

期刊

电视批评中国电视文化电视节目

初中语文个性化作文学习指导策略

初中语文作文教学中，教师应当更多地将个性化作文指导融入课堂，让学生体验不一样的作文课堂，这更有助于学生语言能力和写作素养的培养与锻炼。个性化作文教学不再拘泥于固定形式，作文的内容、主题和写作要求都具有更高的开放程度。这样的教学不仅给学生提供了更广阔的发挥与表达空间，也能够激发学生的写作兴趣与热情。不仅如此，个性化作文教学，还能够促使学生放开思维，在作文中有更多独立思考，学生的写作语言也会更加多元，

期刊

初中语文个性化作文写作语言写作素养作文课堂融入课堂固定形式写作要求

浅析电子商务的发展

电子商务是基于计算机网络并与之有效融合的商务活动,是随着计算机网络而发展起来的一种全新的贸易模式,是震撼社会发展和经济发展的一场新革命的开端,有自己的发展历史、自

期刊

电子商务概念发展盈利模式m—Commerce客户关系立法

脑出血患者的康复期护理

康复期护理的目的在于消除或减轻患者功能上的残损,使患者功能恢复[1]。本文通过对42例脑出血患者恢复期进行针对性的心理疏导、系统详细的健康教育和功能锻炼,使患者树立战

期刊

脑出血康复期护理

城际轨道交通车站给排水设计浅析

结合广珠城际工程实例,分析了城际车站给排水设计的特殊性,针对设计中碰到的难点问题进行了探讨。

期刊

城际车站给水系统排水系统消防系统

界面调控制备金纳米棒-卟啉MOF复合材料及其多功能光疗应用

癌症是一类严重危害人类身体健康与生命的疾病,针对癌症的治疗方法的开发一直是科学与临床的研究重点。光疗是近年来发展的一种新型治疗手段,包括光动力治疗和光热治疗两种主要形式,利用可见或红外光激发注入体内的光敏剂产生单线态氧或高热杀死癌细胞,具有操作简便、起效快、适用性广、副作用小等优点。但目前由于光敏剂总体效率仍然较低,而未能广泛应用于临床治疗。而制备复合材料光敏剂实现光动力光热联合治疗是提高光疗效率

学位

卟啉金纳米棒自组装MOF光动力治疗

不同牙体预备时机对纤维桩粘结强度的影响

目的：研究不同牙体预备时机对纤维桩粘结强度的影响,为临床纤维桩粘结后何时进行牙体预备提供理论依据。方法：收集新鲜下颌单根前磨牙35颗,截冠,完善根管治疗并进行桩道预备,使

期刊

纤维桩预备时机粘结强度

Lasso方法和贝叶斯集成方法在乳腺癌的基因表达方面的生存分析

其他学术论文