有部分参考信号的肿瘤异质性反卷积算法研究

来源 :上海师范大学 | 被引量 : 0次 | 上传用户:xiaohuang1234
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
肿瘤异质性的研究有助于了解肿瘤发生转移的分子机制,对肿瘤患者的诊断和治疗策略的选择具有潜在的指导意义,因此将异质性肿瘤样本反卷积成不同的细胞群是一个十分重要的问题。但在实际的临床实践中,参考信号往往仅有一部分是可用的。解决这一问题的传统方法是使用部分可用的参考信号对混合样本进行回归,并将剩余的信号作为一个新的细胞类型。然而,在我们的模拟研究中,这种方法往往会高估已知细胞类型的比例,而且无法检测出新的细胞类型。本文提出了PREDE模型,它是一种基于迭代的非负矩阵分解算法,该算法利用已知的部分参考信号对异质性肿瘤样本进行反卷积。通过在模型参数的不同设置下进行大量的模拟分析,我们证明了该方法在估计未知细胞的比例和表达谱方面极具有效性。将该方法应用于TCGA肿瘤样本,我们发现了利用癌细胞的细胞比例比浸润性免疫细胞的细胞比例能更好地识别出肿瘤样本的不同亚型。此外,我们还对乳腺癌、皮肤癌、膀胱癌这三种肿瘤样本进行反卷积,并利用得到的细胞类型比例对肿瘤患者进行了生存分析。总的来说,我们的模型推广了现存的异质性肿瘤样本的反卷积算法,并且该方法可广泛应用于多种类型的高通量数据。本论文第一章主要概述了肿瘤异质性反卷积的研究背景及意义,并详细介绍了反卷积算法的研究历史及发展现状,还比较了这些反卷积方法所适用的情况、各自的优点及缺陷。第二章,详细介绍了经典的非负矩阵分解(NMF)算法的原理及求解方法。在NMF模型的基础上,通过固定基矩阵W的一部分列,对NMF模型的数学形式进行修改得到PREDE模型。第三章,将处理后的CCLE数据导入PREDE模型求解,然后从四个方面对模型分析:细胞类型数的选择、不同模型参数下将PREDE模型和现存的方法进行比较、加入免疫细胞进行研究和用三种大鼠组织的混合RNA-seq数据进行模拟。第四章,使用PREDE模型对TCGA真实数据进行研究,并对患者进行生存分析。第五章,对全文进行总结和展望,讨论了PREDE模型的优缺点及未来的研究方向。
其他文献
现实世界主要包含两种不确定性现象,即随机不确定性和模糊不确定性.概率论是处理随机不确定性现象强有力的理论工具,而模糊数学是处理模糊不确定性现象的数学理论模糊差分方
随着计算机等电子科技的迅速发展,其运行速度的加快对散热器的散热提出了更高的要求。由于高热流密度的电子散热问题迫在眉睫,冲击流具有优良的流动特性,所以散热器冲击流动顺势而生。本文主要通过数值模拟方法探究了通道结构形状、流动速度、冲击入口宽度,流动介质等对冲击流散热器流动及传热特性的影响,提出了一种优化散热器流动及传热特性的设计方法。首先设置不同的散热器的结构参数,对不同结构参数的散热器进行数值分析。
论文以川东北马路背地区三叠系须家河组二段储层为研究对象,通过野外踏勘、岩心观察、镜下薄片鉴定,结合物性资料、钻录井资料、常规测井资料解释、成像测井解释,确定了须二
本文主要研究两组肿瘤样本的差异甲基化位点检测问题。DNA甲基化是一种重要的表观遗传修饰,在细胞过程(包括基因调节,发育和疾病)中具有重要作用,并且在大多数类型的癌症中广泛出现调节异常。推断具有不同基因型或表型的两组肿瘤样本之间的差异甲基化Cp G位点是揭示肿瘤发生的表观遗传机制和鉴定癌症亚型的生物标志物的关键步骤。然而,肿瘤纯度作为混杂因素的主要来源,如果考虑不当,两组肿瘤样本之间的不均匀的肿瘤纯
慢性阻塞性肺疾病(chronic obstructive pulmonary disease,COPD)是一类慢性炎症性肺部疾病。据报道仅2017年全球已有300多万人死于慢性阻塞性肺病或者由其引发的相关疾病,这
我国房地产行业近些年发展势头迅猛。“天下粮仓”项目在此过程中也乘着行业东方,取得了一些成绩。然而,随着国家调控政策的升级加码与行业内部竞争的日益加剧,天下粮仓项目正面临着来自外部环境剧变与自身内部局限的重重挑战,迫切需要制定符合自身条件的营销策略,从而实现持续性发展。本文首先回顾了相关营销理论与分析工具,为后续研究奠定了基础;其次,本研究通过梳理天下粮仓项目的营销现状分析出当前存在的问题。随后,利
注塑过程是一个典型的小批量、多产品的间歇过程,具有明显的多工况、多时段、重复性等间歇特性,该过程易受到内外各因素的干扰,导致注塑制品质量不稳定。在实际生产中,注塑过
在当今能源危机的大背景下,节能环保的供热方式能够很大程度地减轻我国能源压力。在推动清洁供暖、智慧供热的大环境下,光电、光热、地源热、空气能等多类清洁能源渐渐参与进来,在很大程度上缓解了供热带来的污染问题。结合动物园各兽舍的供热要求,采用地源热泵供热方式进行供热,能够实现各场馆单独控制,互不影响,同时满足各种动物的不同温度需求。本课题选择石家庄动物园4个兽舍供热区进行供暖系统设计。其中包含9种不同类
目前,太赫兹技术被广泛应用于无线通讯、医疗诊断等各种前沿领域。硅作为太赫兹器件中的重要材料,由于具有高介电常数,通常存在高菲涅尔反射损耗,因此降低硅表面的反射率对于
非贵金属的电化学析氧反应催化剂中,NiFe基水滑石表现出优异的性能被广泛研究。研究表明催化剂的活性与活性位点的周围环境密切相关,本文通过密度泛函理论计算了 Ni3Fe-LDHs