基于多组学数据整合的癌症分型及预后方法研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:asd_012
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
癌症是威胁人类健康的重要疾病之一。近年来,癌症的发病率呈现上升趋势,死亡率也一直居高不下。将同种癌症患者精确地划分成与临床结果显著相关的不同亚型,有益于临床上医生对患者进行有针对性的诊断和治疗,是推动精准医疗实现的重要手段。同时,准确的预后对于指导临床医生对生存期长短不同的患者制定合适的治疗方案有重要意义。传统临床上,主要根据临床特征如肿瘤大小、分级和分期等来判断癌症的亚型及患者的生存期。实际上,癌症是一种在分子水平上具有高度异质性的复杂疾病。随着新一代测序技术的进一步开展,癌症多组学数据得到了广泛的积累。然而不同组学数据的类型和量纲不同,且具有高维、冗余的特点,因此,如何有效地整合多组学数据,以更好地帮助癌症患者分型及预后,是目前癌症生物信息学研究领域中亟需解决的问题。本文围绕上述问题,提出了基于多组学数据整合的癌症分型及预后方法研究。具体而言,本文的主要贡献包括以下几点:(1)提出了一种基于网络整合体细胞突变与基因表达的癌症分型方法,该方法较其它方法在识别癌症亚型上有较好的性能。针对癌症的特异性,设计了一种通过引入癌症特异性网络间接整合体细胞突变和基因表达的癌症分型方法。在数据整合上,该方法考虑了癌症的特异性,首先为不同癌症利用其基因表达谱构建了该癌症特异的显著共表达网络(Significant Coexpression Networks,SCN),然后将基因的体细胞突变映射到该SCN网络上进行传播,最后将传播之后的体细胞突变谱作为特征对癌症样本进行聚类。在聚类上,该方法采用了一种改进的网络正则化非负矩阵分解(Network-regularized Non-negative Matrix Factorization,net NMF)算法net NMF_HC进行更精确的聚类。将该方法应用于卵巢癌(Ovarian cancer,OV)、肺腺癌(Lung Adenocarcinoma,LUAD)和子宫内膜癌(Uterine Corpus Endometrial Carcinoma,UCEC)数据集,结果表明,该方法成功地识别了与生存相关的癌症亚型,且对于本研究中的大部分癌症来说,该方法在识别与临床结果显著相关的有意义的癌症亚型方面,优于传统基于网络的分型(Network-based Stratification,NBS)方法。尤其是,该方法识别到了NBS未发现的与生存期显著相关的UCEC亚型。(2)提出了一种基于相关性整合基因表达与临床变量的乳腺癌分型方法,该方法较其它方法在识别乳腺癌亚型上有较好的性能。针对临床表型不同的乳腺癌样本具有差异的基因表达模式这一特点,设计了一种利用最大相关最小冗余(Maximum Relevance Minimum Redundancy,m RMR)特征选择方法将临床变量间接地整合到基因表达中用于乳腺癌分型的方法。该方法主要包括两个阶段:基因特征选择阶段和样本聚类阶段,其中数据整合处于基因特征选择阶段。该方法利用m RMR选择表达值与临床变量的相关性最强且其特征之间冗余度最小的基因集合作为特征,然后基于这些所选的基因表达特征使用K-means对乳腺癌样本进行聚类。与两种典型的仅基于基因表达的乳腺癌分型方法(微阵列预测分析(Prediction Analysis of Microarray 50,PAM50)和最高变异性(Highest Variability,HV))相比,该方法在识别与5年生存期和复发时间都显著相关的亚型方面优于其它两种方法。尤其是,该方法识别出了PAM50和HV都无法识别的与复发相关的乳腺癌亚型。此外,该方法还发现了与生存相关的三个Luminal A子亚型及两个Luminal B子亚型。(3)提出了一种基于多核学习整合体细胞突变的乳腺癌预后方法,该方法较其它方法在乳腺癌预后方面具有较高的准确率。针对体细胞突变对乳腺癌预后的作用及多组学数据高维、冗余的特点,设计了一种利用多核学习(Multiple Kernel Learning,MKL)整合体细胞突变等多组学数据对乳腺癌进行预后的方法。该方法首先利用m RMR特征选择方法分别为不同类型的组学数据选择与生存期相关性最大且内部冗余度最小的特征集合,然后采用多核学习MKL有效地将体细胞突变和目前常用的基因表达、拷贝数变异、甲基化和蛋白质表达等分子组学数据整合到乳腺癌预后模型中。实验结果表明,该方法比其它方法取得了较高的乳腺癌预后性能。通过比较不同组学数据模型发现,整合体细胞突变明显提高了乳腺癌预后准确率。通过比较不同特征选择方法发现,m RMR比本文其它特征选择方法的预后性能更优。此外,在多组学数据整合方面,MKL比其它传统分类器具有更优的预后性能。
其他文献
农村贫困状况是由自然环境、制度、人力资本因素共同作用的结果,长期以来,城乡二元结构体制和薄弱的农村经济社会基础,造成了农村贫困人口多、分布广的基本格局。消除贫困、改善民生、实现共同富裕是社会主义的本质要求。《中国农村扶贫开发纲要(2011-2020)》提出:“改善贫困地区农田水利基础设施、普及基础教育、健全医疗卫生服务、解决饮水安全、提高通车率、完善社会保障等方面的目标”。《国民经济和社会发展第十
本文基于形态特征和部分DNA条形码证据对我国云贵高原跳蛛科蜘蛛进行了系统分类研究。前言部分对跳蛛科的研究简史及现状、分类特征、分类地位及分类系统、研究方法以及云贵高原基本情况进行了介绍。各论部分记录了云贵高原62属157种跳蛛,包括新属2个、中国新纪录属4个、新种32种、单性补充种10种、中国新纪录种3种;并基于检视标本及对比跳蛛鉴别特征图,提出了6个新组合和6组异名。新属包括:华胞蛛属China
党的十八届四中全会提出推进“以审判为中心”的诉讼制度改革,是实现程序法治和司法公正的制度保障。庭审实质化是实现审判中心的基本方式,所有的证据都必须在法庭上查证属实后才能作为定案的根据。鉴定意见作为一种诉讼证据,本质上属于言词证据,却又不同于当事人陈述、证人证言和口供;作为一种具有科学属性的证据,又不同于物证、书证一样的客观存在。我国对于鉴定意见的质证一直进行着相关的制度改革和创新,学界也一直在进行
苏联解体以后,乌克兰在转型背景下开启了独立建国之路。独立至今的30年间,乌克兰的社会转型与国家建构之路充满了艰难险阻,先后爆发了“颜色革命”、乌克兰危机。以乌克兰为案例,探讨社会转型与国家建构关系不仅有重要的理论意义,也有非常重要的现实意义。乌克兰的转型是以西方民主制度为模板多维度的转型,在政治维度,转型的目标是建立代议民主制度;经济维度是从计划经济过渡到市场经济;社会维度是推动国内公民社会的发展
仔猪在断奶阶段采食量降低、肠道功能紊乱,易发生腹泻致使其生长性能下降,严重影响生猪养殖业的生产效益。抗生素可缓解以上症状,但是抗生素的滥用对畜禽食品安全和人类健康存在一系列不利影响。随着各国在饲粮中禁抗措施的实施,寻找替代抗生素的产品、制定不妨碍动物生长性能的替抗策略已成为动物营养研究的重点和热点。单宁酸是一种具有抗菌、抗炎、抗氧化等多种天然活性的植物多酚,被认为是潜在的抗生素替代物。然而单宁酸适
作为全球最具战略意义的商品,原油被称为“能源之王”,且兼具商品、金融以及政治三重属性,是许多经济体的生命支柱,对各行各业都存在巨大影响。事实上,自2008年金融危机后,国际油价变化进入了新的发展阶段,价格大起大落,波动性显著增加,其波动显然无法再用传统的供需关系等影响因素来解读。原油价格的金融化特征日趋显现,而原油在全球可持续发展中的重要性使其在金融化中具有更为核心的地位和独特的性质。原油金融的重
俗话说:一方水土养一方人。福建地处东南沿海,山清水秀、天蓝海碧,自然风光旖旎、文化底蕴深厚、气候舒适宜人,是一个宜居、宜养、宜游的福地。然而,美好河山中也有"养不好一方人"的地方,或深山老林、交通闭塞,或地质复杂、生态脆弱……"穷",对于居住在这些地方的人来说,就像是宿命,难以逃脱。久困于穷,冀以小康。易地扶贫搬迁,是习近平总书记亲自出的考题,是实现全面小康的一项浩大工程,更是人类向贫困宣战
期刊
电视媒介深刻体现了“视觉领域的社会建构”和“社会领域的视觉建构”这一二元结构关系。电视媒介对于我国西北边疆地区——新疆的呈现也深蕴着社会与媒介之间的双向建构与交互影响。新疆既是我国西北重要的安全屏障,是“一带一路”建设向西开放的桥头堡,同时又面临着一定的意识形态威胁,在国家政治、经济、文化战略中均处于重要地位。作为外在形态和内在气质的统合性图景及内部、外部公众对该地域的感知与评判,新疆形象也直接关
紧耦合阵列天线与传统的宽带阵列天线在单元间距选择上有所不同,避免了在设计时要兼顾带宽与栅瓣的问题。在传统阵列中,单元间距太大会使高频扫描时产生栅瓣,单元间距太小会引起强互耦,影响阵列带宽。而紧耦合阵列天线的单元间距略小于最高频的半波长,避免了高频在扫描时产生栅瓣;并且通过在阵元之间引入耦合电容增强互耦,抵消偶极子在低频的对地感抗,拓展最低工作频率,实现超宽带。此外,紧耦合阵列天线还具有低剖面,易于
对海雷达通常设计为具有高距离分辨率或者低距离分辨率的目标检测和高距离分辨率识别的双工作模式。由于海杂波功率水平与雷达分辨单元的面积成正比,在高分辨对海雷达中,海杂波功率水平低,使得海面小目标和低可观测目标的检测成为可能。通常情况下,高分辨对海雷达发射大时宽-带宽积的线性或者非线性调频脉冲,并通过脉冲压缩技术实现高距离分辨率。然而,在获得高距离分辨率的同时也带来了难以避免的副作用:海杂波的强非高斯性