基于稀疏低秩回归方法的肿瘤亚型聚类分析

来源 :安徽大学 | 被引量 : 0次 | 上传用户：boat_y

【摘要】

：

当前,癌症是导致人类死亡的主要疾病之一。随着第二代测序技术的发展,世界各国的学者实施了大规模癌症基因组测序工程(例如TCGA),获得了大量不同类型的生物学数据(例如mRNA表

【作者】

：

葛曙光

【出处】

：

安徽大学

【发表日期】

：

2017年期

【关键词】

：

多组学数据稀疏低秩回归聚类算法癌症亚型

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

当前,癌症是导致人类死亡的主要疾病之一。随着第二代测序技术的发展,世界各国的学者实施了大规模癌症基因组测序工程(例如TCGA),获得了大量不同类型的生物学数据(例如mRNA表达数据,DNA甲基化数据,体细胞突变数据),对于理解癌症的发病机理,寻找肿瘤的准确亚型,设计出治疗癌症的有效药物等方面产生了积极影响。然而,新的问题也随之而来,如何充分整合和利用多组学的生物测序数据来设计出肿瘤亚型聚类算法,成为生物信息学研究的热点之一。目前,肿瘤亚型聚类常用的分析方法仍是半监督或着无监督的对单一的生物组学数据的样本分配。但这类方法存在的缺陷是多种相关性数据类型不能用于一个单独的聚类方法,容易造成信息损失。近几年来,基于多组学生物数据,研究者提出了一些肿瘤亚型聚类分析算法。但这些方法还处于发展的早期阶段,仍然存在许多问题亟待解决。如基因的预筛选问题、构建真正意义上的数据整合模型、得到更为准确的结果等。因此迫切需要发展新的数据分析方法。本文中,我们研究工作的核心思想是基于稀疏低秩回归的方法,把高维度的多组学数据投射到一个低维度的含有主要的生物过程的子空间里,最终达到数据融合和快速聚类的目的。第一章介绍了基于多组学数据的亚型分析的研究背景、研究意义,以及国内外研究现状和主要的研究方法。第二章介绍了各种研究癌症亚型常用的数据和,列举回顾了多种具有代表性的整合多种数据的聚类算法。第三章介绍了基于稀疏低秩回归方法优化iCluster算法的理论。我们基于稀疏低秩回归的方法代替了优化的PCA的算法,计算出具有稀疏低秩性的系数矩阵的初值,保证了后续迭代过程中估计出最优的后验概率值。与iCluster算法相比的比较实验也验证了算法改进的有效性。第四章介绍了基于稀疏低秩回归的方法提出的Scluster聚类算法的理论。它是用一种用该方法首先利用合适的稀疏低秩回归的方法来从每种生物数据中发现有效的低维度的子空间,然后整合这些子空间为一个样本-样本的相似矩阵,最后用谱聚类的方法识别癌症亚型。对于在三种不同的癌症类型数据集上的实验结果表明,我们提出的Scluster在预测生存周期上更加有效。在GBM的亚型分析中,基于表达数据和甲基化数据的整合,我们的方法能更有效的捕捉到生物上的特征和发现亚型中的子集,发现了一种隐在的新型亚型。第五章介绍了研究中的一些问题并总结全文、展望未来的发展方向。

其他文献

中国企业应加速在东盟的本土化

<正>近期,看准印尼智慧型手机市场快速发展,中国企业正加速就手机制造以及电商等行业展开布局。手机制造商OPPO已在印尼开设海外第一座工厂,预计产能将达到每月50万台。截至2

期刊

手机制造智慧型本土化

下调DNA修复基因GADD45A增强黑色素瘤化疗敏感性的机制研究

背景:黑色素瘤是一种皮肤恶性肿瘤,其早期不易发现,晚期极易转移,并且具有极高的化疗耐药性。目前,癌症治疗最有效的手段是手术、放疗、化疗和免疫治疗。化疗是一种全身治疗

学位

黑色素瘤GADD45A化疗耐药性DNA损伤修复

生态脆弱区不同模型下多尺度景观生态风险评价

作为景观生态学的核心之一,多尺度综合分析已经成为景观生态风险评价过程的重要环节,它对于理解多尺度的景观生态风险,提高景观生态风险的评价精度具有重要理论和实践价值。本文以陕西省米脂县高渠乡为研究区。首先,选择8个景观格局指数,分析景观生态风险在30m、60m、90m、120m、150m、180m等不同空间粒度下的变化趋势,确定适宜的研究粒度。其次,对研究区进行尺度划分,分别为样方尺度、行政尺度、生态

学位

景观生态风险空间粒度模型多尺度综合适宜尺度高渠乡

PDCA循环管理在核磁共振水冷系统维护维修中的应用

本文简述了PDCA循环管理过程,介绍了它在核磁共振设备水冷系统维护维修中的应用。经过一系列改进措施,提高了水冷系统的设备完好率,保证了核磁共振设备工作日开机天数,从而增

期刊

PDCA核磁共振设备水冷系统鱼骨图

代数运算表其外,几何性质蕴其中——一道高考解析几何问题的开放性变式研究

<正>我们知道,高考试题大多是独具匠心的佳作,一方面体现了在知识交汇点处命题的创新原则,另一方面一些试题格调清新、意境幽深,堪称命题专家集体智慧的结晶,不可等闲视之,是

期刊

抛物线对称轴几何性质代数运算开放性

直流下交联聚乙烯电缆局部放电的试验特性研究

为研究直流电压下交联聚乙烯(cross linked polyethylene,XLPE)电缆绝缘局部放电特性,搭建了一套XLPE电缆直流局部放电试验及检测系统,使用直流局放仪和高频电流法(high freq

期刊

交联聚乙烯(XLPE)电缆直流局部放电Comsol仿真指纹特征

要让每一个孩子的人生都出彩

<正>党的十九大报告提出,要努力"办好人民满意的教育",对"培养什么人、怎样培养人"赋予了新的内涵,教育的作用和地位得到进一步凸显,推进教育事业科学发展的方向更为明确,作

期刊

生本教育十九大报告

万州区滑坡灾害风险管理对策

滑坡灾害风险管理是实现滑坡灾害防灾减灾的有效途径。以三峡库区万州区为例，从分析万州区滑坡灾害风险管理的现状人手，总结了万州区滑坡灾害风险管理采取的主要手段和存在的问

期刊

滑坡灾害风险管理对策区域尺度单体尺度万州区

未成年人刑事法律援助的现实困境与路径选择

国家责任还是律师责任?未成年人刑事法律援助制度建立的逻辑基础割裂,由此产生诸多的现实困境。未成年人刑事法律援助应当作为一项社会事业,由各方主体在其中各司其职以实现

期刊

未成年人犯罪刑事法律援助未成年人保护社会事业建设专业化建设

基于单车诱导技术的特种车辆交通诱导信息系统研究

单车诱导信息系统是利用先进的信息技术及时采集和处理动态交通信息，为单个车辆进行路径实时诱导提供信息的系统。将单车诱导技术应用于特种车辆的交通诱导，将能够有效提高特种

期刊

交通诱导特种车辆单车诱导信息系统

基于稀疏低秩回归方法的肿瘤亚型聚类分析

其他学术论文