基于深度聚类模型和传统模型的多组学数据整合分析方法和系统

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:java777
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着科学技术的发展,大量的多组学数据也应运而生。这些整合后的组学数据能够较全面的从多个分子层面对疾病进行观测和诊断,从而对患者进行全面的分子分型,为精准医学的发展做出贡献。目前已经有许多研究多组学数据的方法,然而这些整合方法通常是以程序包的形式展现出来,其方法比较固定单一且只针对某些特定类型的数据,不能供使用者选择。同时他们也很少将降维和聚类联合用于多组学数据,使得聚类的效果不尽人意。而这些问题对于多组学数据研究和无编程经验的研究者来讲是一个巨大的挑战。为了解决这些问题,本文提出了一个基于深度聚类模型和传统模型的多组学数据整合分析方法,并开发了一个系统,简称IOAT。它为非编程人员研究高维多组学数据提供了许多方法。在这里,IOAT为用户提供了多样化数据预处理,特征筛选,聚类以及生存分析等相关功能。本系统针对多组学数据是否具有先验标签将流程分为了两大类:第一类针对有标签的多组学数据,本文提出了一个基于标准化欧式距离的联合深度聚类方法(DKM+)。该方法将聚类的方法嵌入到降维模型中进行联合优化,并针对多组学数据的特点使用了标准化欧式距离的方法来计算降维和聚类模型的损失函数中的相关距离,从而使联合优化模型得到更好的聚类结果;第二类针对无标签的多组学特征提供了单因素多因素特征选择方法。每种方法可自由组合。特征降维后,用户还可对这些特征进行风险评估并预测不同时间段的生存概率。接下来,用户可以选择自己设定或系统设定聚类数两种方式对筛选后的特征进行聚类,并将生存分析效果好的聚类数作为亚型分类结果。该系统已在TCGA的多个真实癌症项目数据和模拟数据集上进行了充分地验证。综上所述,本文提出的方法和开发的系统可以为不同类型的多组学数据提供多样化的数据分析方法。其特征选择的结果可以为那些医务人员和生物学家提供与肿瘤分期密切相关的基因,作为组学和临床表型之间联系的参考,从而有助于建立个性化的癌症治疗计划。其聚类的结果可以为他们提供一个特定癌症分子亚型的参考,从而帮助患者进行精准化治疗。
其他文献
三阴性乳腺癌(TNBC)是一种诊断难、侵袭强、复发和死亡率高的乳腺癌亚型。由于TNBC无特异性受体和复杂的肿瘤微环境(TME),目前仍缺乏有效的治疗手段。近年来,纳米技术的兴起为提高TNBC疗效提供新的思路,即开发了多种具有TME响应型纳米材料改善或利用TME以实现TNBC的高效治疗。但目前大部份材料相对单一的响应治疗模式效果仍然不佳。针对以上问题,我们采用双管齐下的研究思路,从TME与材料物化特
随着人类对生命奥秘的不断探索,以基因工程和细胞工程为代表的现代生命科学受到了极大的重视。其中,显微注射是一项广泛应用于这两个领域的常规实验操作技术。显微注射采用手动操作除了费时费力外,其不可避免的对准和穿刺过程的轨迹误差,会极大影响操作对象的成活率。因此,细胞显微注射自动化是近年来跨学科的研究热点,包括细胞的姿态调整方法和穿刺力控制的研究。本文针对常规显微视觉微注射深度感知的困难,提出以双目远心相
伴随着飞速增长的能源消耗,是一次能源短缺的紧迫感和能源消费过程带来的碳排放量增长以及其他环境污染。使用废弃物或生物质代替传统的化石燃料作为可持续能源对于实现低碳发展具有重要意义。农村生活垃圾量大,充满资源性和危害性;微藻作为第三代生物质能源,具有诸多利用价值。本文通过微藻与农村生活垃圾共热解,探究二者快/慢速、原位/非原位催化热解的性质,为二者的资源综合利用提供技术手段。研究了二者单独热解的特征。
高速钢在工业生产中应用广泛,是一种重要的工具材料。在传统热处理的基础上进行表面涂层的制备可有效提高高速钢工具的服役寿命等综合性能,具有重要意义。类金刚石薄膜(DLC)是一种性能优异的硬质涂层,但由于膜基结合力差、内应力较大、热稳定性差的问题限制了其应用范围。深冷处理作为一种操作简便、安全环保、有效改善材料组织及性能的工艺,在金属材料方面的研究较为广泛,但深冷处理在涂层领域的应用与研究并不充分,国内
为了解决轻薄化电子器件在高热流密度下的散热问题,需要开发出厚度更薄、传热性能更好的超薄均热板。然而,超薄均热板厚度进一步减小容易导致其在封口焊接过程中发生泄漏,从而使超薄均热板的使用寿命受到影响。此外,封口焊接强度不足会导致超薄均热板的二次除气效果变差,从而使超薄均热板的传热性能下降。因此,为了满足超薄均热板高传热性能和长使用寿命的要求,本文对厚度小于0.4 mm的超薄均热板的二次除气和封口焊接机
长周期地震动相较于普通地震动往往能够造成更严重的结构破坏,尤其是长周期结构的破坏。长周期地震动的场地卓越周期往往与长周期结构基本周期相近,易形成双共振,导致结构响应更为激烈,因此有必要对超高层结构在长周期地震动下的减震设计以及抗震性能评估进行深入研究。本文基于某200.5米高的框架—核心筒结构实际工程,研究不同类型长周期地震动下结构的减震设计,并从构件和结构整体的角度分析减震结构的抗震性能,主要研
目的:在循证医学研究范式下,基于临床特征数据和专家经验,探究不同的完全性房室间隔缺损(Complete Atrioventricular Septal Defect,cAVSD)的手术质量评价指标。方法:回顾性纳入单中心2009年11月1日至2020年7月15日接受一期矫治的cAVSD患者。排除合并非双心室矫治的患者,以单因素和多因素逻辑回归分析cAVSD术后在院不良事件相关的风险因素。排除合并非
二氧化碳(CO2)是主要的温室气体同时也是丰富的碳一(C1)资源,通过炔烃的羧基化反应将CO2转化为炔酸是CO2利用的有效途径。同时,炔烃半氢化反应制备烯烃在有机合成中也具有重要作用。因此,发展高效的炔烃羧基化反应和炔烃半氢化反应具有重要的理论意义和实用价值。本论文围绕炔烃和CO2的利用开展研究,一方面将CO2作为C1资源,直接与端炔发生羧基化反应生成炔酸,实现了CO2的转化;另一方面,发展了一例
虚拟现实技术可以高度还原人在真实世界中视觉和听觉感知行为,但仅包含视听觉交互的虚拟现实场景已经不能满足消费者日益增长的真实感和沉浸感等需求,虚拟现实多模式交互越来越受到重视。虚拟现实交互中力反馈交互模式的探究以及功能性微电流刺激的研究深入,为虚拟现实力反馈交互提供了理论基础和实践的可行性。目前基于微电流刺激的虚拟现实力反馈领域,存在以下问题亟待研究。首先,研究领域较少面向虚拟力反馈的微电流多模式研
实际工业生产中会产生大量的共沸或近沸点混合物。针对当前共沸物系变压精馏工艺能耗高的特点,本文集成热泵精馏、差压热耦合精馏、侧线精馏的特点,提出了一个全新的变压精馏工艺。针对最低共沸物系,其特点是:1)高压塔顶气并联做为自身(经压缩后)和低压塔的再沸热源;2)取消低压塔顶冷凝系统,将低压塔顶气压缩后送入高压塔中部,以升级利用其余热;3)从高压塔中部抽出液相侧线送低压塔顶部做回流,形成侧线蒸馏流程,以