基于深度学习的SCRNA-SEQ分析和下游任务方法

来源 :山东大学 | 被引量 : 0次 | 上传用户:whisperings
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
活细胞构成大量生物实体之间相互作用的复杂系统。基因、转录产物、蛋白质、代谢物和物种以时间和空间控制的方式进行细胞过程。通常,这些相互作用及其参数不能通过实验直接测量。2013年标志着单细胞测序被公认为最有希望解决复杂生物学研究问题的测序方法。从那时起,单细胞测序技术得到了进步,导致单细胞数据显著增加。然而,处理这些庞大而复杂的数据集的计算挑战增加了三倍。通常,单细胞测序技术需要设计一个建模方法,然后这些算法的适用性取决于用例,特别是问题的大小。一般来说,所有方法都受到生物测量中的噪声、与模型复杂性相关的稀缺数据以及非线性和组合行为的挑战。然而,所需的计算成本高的数值算法必须以计算有效的方式实现。通过将深度学习(DL)等人工智能(AI)方法与单细胞RNA测序(scRNA-seq)技术提供的生物数据相结合,可以揭示细胞的潜在结构并更准确地预测细胞的有效亚群。然而,在涉及生物因素和技术噪音时,这种有说服力的技术是微妙的。由于各种原因,单细胞数据分析可能是计算密集型的,例如在数据中输入缺失值、对其进行去噪、考虑数据的零膨胀(ZI)特性,以及最具挑战性的是降维。除了传统的机器学习(ML)方法之外,深度学习(DL)被认为是单细胞分析的一个有竞争力的选择。深度生成方法可以从组学数据中学习底层结构,例如路径或基因系统。我们对此类分析技术进行了介绍和概述,特别说明了它们在单细胞表达数据中的用法。具体来说,在论文中,提出了深度学习(DL)模型的统一数学公式;变分自编码器(VAE)、自编码器(AE)和生成对抗网络(GAN),比较它们的训练步骤和策略及其损失函数,还将这些模型类型的损失函数与单细胞RNA-seq数据处理步骤中的特定对象相联系。深度生成模型通过有效封装基因对之间的非线性依赖关系,帮助学习高维多组学和单组学数据的结构;由于它们基于神经网络(NN)的结构块,它们通常难以解释。论文的描述风格将有助于为分析管道的每个级别选择合适的算法。对最近建立的模型和技术的全面调查将作为一个有用的信息门户,用于了解深度学习(DL)在scRNA-seq分析中的应用,并激发其在多领域新兴挑战任务中的应用-组学和单细胞测序领域。关键点:1.单细胞RNA测序技术生成数百万个转录组图谱,允许对隐藏的表达功能结构或细胞类型进行生物学研究,更准确地预测它们的效果或对治疗的反应,或利用亚群来弥补研究空白。2.本研究检查了当前基于深度学习(DL)的单细胞数据分析算法所面临的挑战及其在分析管道中的作用。3.每项技术都对所调查的深度学习(DL)模型进行了数学解释,并对模型的特殊属性进行了讨论。4.还对每种技术都提供了对评估措施、比较算法和数据集的全面概述。5.最后,我们使用单细胞表达数据证明了在实际应用中概述的策略的适用性。6.我们提出了一个基于深度学习的管道,用于使用自编码器进行降维的单细胞RNA-seq下游分析。
其他文献
近些年来,国际金融市场越来越自由、越来越连通,市场日益动荡,市场主体面临的风险也日益增加。期权作为有效对冲风险的工具越来越被大家重视,大量学者致力于期权定价并提出了一系列期权定价的方法。Black和Scholes于1973年在一系列假设下,提出了 Black-Scholes(B-S)期权定价模型。研究表明,标的物价格的波动率是影响期权定价的重要因素,而广义自回归条件异方差(GARCH)模型可以很好
学位
历史上人类社会一直在受到传染病的威胁,且每次传染病的出现都会对社会的经济发展和人类的身心健康带来很大的影响和伤害.因此为了尽可能的减少传染病对于人类的影响和伤害,根据已有的传染病建立数学模型具有重要的意义,本文主要是研究带有饱和发生率和线性源的反应扩散SIR模型.第一部分首先介绍了国内外一些重大传染病的发展情况和历史,接着说明了建立传染病模型的重要性以及国内外研究现状,最后简单地介绍了本文主要做的
学位
投资组合选择是量化投资领域的一个基础研究问题,其含义是科学地分配一组资产的资金投入比例。随着机器学习技术的发展,作为其重要分支的在线学习算法得到了更广泛的应用,通过在线学习算法选择投资组合逐渐成为一个重要的研究方向。同时,随着我国的经济实力不断增强,股票市场的流动性和活跃性不断提高,股票市场的信息也变得越来越庞杂。在这种情况下,吸纳更多市场和上市公司的信息、利用在线学习算法构建投资组合策略具有越来
学位
[目的]阿尔茨海默病(Alzheimer’s disease,AD)作为一种进行性疾病,因其不断恶化的发病现状和治疗难度,不仅影响着全世界人类的健康,而且日益加剧对社会的负担。AD的发病机制尚未明确,标志性病理特征主要表现为神经原纤维缠结、淀粉样斑块沉积以及大脑皮层和海马区的神经细胞死亡。目前的治疗方法不能完全治愈AD,且伴有不同程度的不良反应。按照多靶点策略的药物开发模式,天然来源的小分子化合物
学位
本文介绍了陶瓷与不锈钢的一步钎焊法。试验结果指出:Cu-Ti活性纤料具有较好的可钎焊性,润湿性,抗裂性以及价廉等特点。因此,它具有较好的实用价值。
期刊
8月8日,动物防疫法修订草案提请十三届全国人大常委会进行第二次审议。草案二审稿进一步加强集贸市场和畜禽活体交易管理,明确犬、猫防疫管理规定,建立人畜共患传染病防治合作机制,并对非食用性利用野生动物的检疫、实验动物的防疫等内容进行修改完善。
期刊
随着网络技术的迅速发展,人们如何能够通过不见面的方式达到共享一组密钥的目的,成为了一个重要的研究问题,密钥协商方案为解决这一问题提供了可能.密钥协商是指两个或多个成员通过在一个可公开信道上通信、共同生成一组密钥的过程,任何一个通信方均会对密钥的值产生影响.通信方可以利用生成的密钥,进行加密与解密.密钥协商方案分为经典密钥协商(Classic Key Agreement,CKA)方案与量子密钥协商(
学位
在过去一二十年里,中国的城市物流取得了长足发展,但乡村物流情况受距离远、货物少、成本高的影响,导致发展缓慢.零担物流模式对于城乡物流的发展起着积极作用,如何解决零担物流中的难题对发展乡村物流,有着重要的研究意义.针对国内城乡物流的特点,主要研究基于微型集装箱的零担物流循环取货模式下的车辆路径与调度问题.基于某零担物流龙头公司现有的三级站点情况及其首创的微型集装箱运输模式,以实际数据为驱动,分别研究
学位
期刊
目的:探讨内镜黏膜下剥离术治疗大肠侧向发育型肿瘤患者的疗效。方法:选取2018年1月至2022年7月在阳江市人民医院行内镜手术治疗大肠侧向发育型肿瘤的68例患者,随机分为两组,观察组33例行内镜黏膜下剥离术治疗,对照组35例行内镜下黏膜切除术治疗,比较两组患者治疗效果。结果:观察组患者手术时间、住院时间、术中出血量均多于对照组,差异具有统计学意义(P <0.05);观察组患者完整切除率、≥3 cm
期刊