【摘 要】
:
由多个致病基因共同作用所导致的复杂疾病具有遗传模式繁杂、高发病率和高致死率等特性,这些特性使复杂疾病严重威胁了人类的健康。因此,研究复杂疾病的发病的机理是当前亟待解决的问题。复杂疾病又称多基因疾病,挖掘复杂疾病相关的基因有利于揭开复杂疾病神秘的面纱。根据中心法则可知,脱氧核糖核酸(DeoxyriboNucleic Acid,简称DNA)可以转录成为核糖核酸(Ribonucleic Acid,简称R
论文部分内容阅读
由多个致病基因共同作用所导致的复杂疾病具有遗传模式繁杂、高发病率和高致死率等特性,这些特性使复杂疾病严重威胁了人类的健康。因此,研究复杂疾病的发病的机理是当前亟待解决的问题。复杂疾病又称多基因疾病,挖掘复杂疾病相关的基因有利于揭开复杂疾病神秘的面纱。根据中心法则可知,脱氧核糖核酸(DeoxyriboNucleic Acid,简称DNA)可以转录成为核糖核酸(Ribonucleic Acid,简称RNA),而RNA又可以逆转录为DNA。基因又属于DNA中有遗传信息的片段。因此基因和RNA之间存在着重要的联系。同理,RNA与复杂疾病也存在一定的关联。所以,挖掘复杂疾病相关的RNA同样至关重要。通过传统生物实验的方法挖掘复杂疾病相关的基因和RNA虽然可信度高,但是人体内的基因和RNA不可胜数,利用生物实验的方法验证必将耗费大量的人力、物力和财力。而通过计算的方法从海量的基因和RNA中挖掘出高概率与疾病相关的基因或RNA,可以为研究人员进行的生物实验提供参考,即缩小了识别复杂疾病相关的基因和RNA的研究范围,相比单一采用生物实验的方法可以节省大量的资源。本文基于生物网络采用不同类型的计算方法挖掘了疾病相关的基因和circRNA(circlular RNA),具体研究工作如下:第一,提出基于重构的蛋白质相互作用(Protein-protein interaction,PPI)网络的逻辑回归算法识别疾病基因模型。首先,针对传统的PPI网络通常具备度分布极度不均衡、稀疏和高噪声等缺陷,在PPI网络的基础上运行基于异构网络的的重启随机游走算法(Random walk with restart on heterogenous network,RWRH)算法计算了它的拓扑相似性,进一步重构了 PPI网络;其次,为了从多种生物学视角研究基因-疾病关联关系,在重构的PPI网络、蛋白质复合物、基因组织表达、Keywords信息以及基因的语义相似性数据中抽取了异构特征。最后,使用逻辑回归算法利用提取的特征识别疾病相关的基因。通过实验分析可知,该算法可以很好地从多种生物学视角挖掘疾病相关的基因。第二,提出基于异构网络的两轮随机游走算法识别癌症相关的基因模型。为了解决单一生物数据构建网络会忽视生物大分子多样性的问题,首先基于多种类型的生物学数据(PPI网络、通路基因网络、miRNA网络、lncRNA网络、癌症相似性网络和蛋白质复合物)构建了一个大型的异构网络。其次,基于相似的疾病很有可能与功能上相似的基因存在关联关系的现象,将不同癌症归为一个大的癌症类。然后,利用第一轮随机游走算法挖掘高概率的癌症类基因。并基于高概率的癌症类基因和其他类型的生物学数据构建一个新的异构网络。最后,在新的异构网络上采用第二轮随机游走算法识别特定的癌症相关的基因。实验结果表明,此方法相比领域中其他方法能够更好地识别癌症相关的基因。第三,提出基于异构网络的偏随机游走算法识别疾病相关的circRNA模型。首先,为了避免深度优先搜索算法耗费大量时间的缺点,提出了一种偏随机游走算法来搜索路径。此外为了弱化当前circRNA-疾病关联关系较少带来的负面影响,构建了由circRNA、靶基因、疾病和它们之间的关联关系组成的大型异构网络,在构建的异构网络借助circRNA-靶基因-疾病模式增强circRNA与疾病之间的关联。最终,在构建的异构网络上运行偏随机游走算法识别疾病相关的circRNA。实验结果表明,该算法可以很好地挖掘未知的疾病相关的circRNA。第四,提出基于多数据融合的circRNA-疾病关联关系预测模型。针对circRNA-疾病关联关系数据较少而导致预测出现偏差的问题,首先融合了 circRNA表达谱数据、疾病相似性网络数据以及多个数据库中circRNA-疾病关联关系,然后采用了改进的非负矩阵分解算法解决了该问题。在实验过程中通过交互网络分析可知,该算法在预测未知疾病相关circRNA上有着卓越的表现性能。综上所述,本文为两大模块,即预测疾病相关的基因以及circRNA,在每一个模块下分别提出两种计算方法。在对比其它方法对比以及预测未知的疾病相关的基因和circRNA上都取得令人满意的结果,对研究导致复杂疾病产生的基因和circRNA具有重要的意义。
其他文献
氨(NH3)是一种重要的化工产品,已被广泛用于农业、制药、能量存储等许多领域。当前的工业NH3生产主要依赖于Haber-Bosch工艺,但该工艺存在能源效率低、设备要求严格和CO2排放量大等不足。环境条件下的电化学合成NH3通常以水为质子源,由可再生能源产生的电能驱动反应进行,有效降低了能耗与碳排放量,为可持续NH3合成提供了一种绿色环保的方法。但在水性电解质体系中,竞争性析氢反应(HER)的存在
二氧化硅(SiO2)、聚苯乙烯、酚醛(RF)和金属氧化物等纳米材料,在日常生活及工业生产中有重要的使用价值,近年来受到了广泛的关注。其中,SiO2纳米粒子因具有良好的热稳定性以及生物相容性而备受科研工作者的青睐。与密实的SiO2纳米粒子相比,介孔带来了额外的比表面积和孔体积,这使得介孔二氧化硅纳米粒子(MSNs)在吸附-脱附、催化、能量储存-释放和生物医学等方面起着不可替代的角色。因此,赋予密实的
α,β-不饱和醛具有共轭的C=C双键和C=O双键,其选择加氢生成α,β-不饱醇或饱和醛到目前为止仍然是一个具有挑战性且尚未完全解决的问题。特别是α,β-不饱醇,其自然资源匮乏但在香料、化妆品、医药中间体等领域需求广泛,成为精细化工中不可或缺的化学物质,引起了广大科研工作者对α,β-不饱和醛选择加氢制备α,β-不饱醇的研究兴趣。然而无论在热力学还是动力学角度,C=C双键比C=O双键更易加氢且更具反应
水凝胶是一种可吸收大量水的三维聚合物网络,与生物组织之间有很好的相似性和相容性。作为导电性能极佳的材料,在柔性传感领域有非常广泛的应用前景。因此,开发具有耐用性,粘附性,可修复性,高灵敏的水凝胶传感器将对柔性电子学的发展起到关键作用。本论文论述了两种以κ-卡拉胶和聚丙烯酰胺为主要基材的双网络水凝胶柔性传感材料分子结构设计以及制备方法,在提升水凝胶应变敏感性的同时,突破了耐用性等应用瓶颈。首先,制备
杂原子分子筛不仅扩展了传统分子筛的定义,在新的应用领域也能够取得巨大成果。其中,钛硅分子筛以及锡硅分子筛因催化条件温和,效率高,副产物只有水,符合“绿色化学”的要求而受到广泛关注,是目前研究最多的杂原子分子筛。首先,采用钛硅分子筛/H2O2催化体系研究了环戊烯的液相环氧化反应。在所考察的所有钛硅分子筛(Ti-Beta、Ti-MOR、Ti-MCM-68、TS-1、TS-2和Ti-MWW)中,由于扩散
酚醛树脂作为三大热固性树脂之一,具有耐热、耐燃、化学稳定性好等优点。但生产酚醛树脂所使用的苯酚原料和甲醛毒性大,且苯酚来源于石工产品且具有不可再生性。生物质基高分子木质素中既有酚羟基又有醇羟基,具备替代苯酚生成生物基酚醛树脂的潜力。然而,天然木质素分子量大、结构复杂、空间位阻大导致不易进行聚合反应,需要进行改性或者将其解聚才能替代苯酚应用于酚醛树脂的合成。在这篇工作中,我们首先以Ru/C为催化剂及
环氧氯丙烷(ECH)又名表氯醇,是一种易挥发的无色油状液体。其作为一种重要的有机原料和精细化工产品,应用领域十分广泛,主要用于生产环氧树脂、甘油和氯醇橡胶等。目前全世界用于工业生产ECH的方法主要有丙烯高温氯化法、甘油法、醋酸丙烯酯法。但存在副产物多、环境污染严重、原子经济性低等问题亟待绿色化改造。Ti-MWW/H2O2体系催化氯丙烯环氧化直接制备环氧氯丙烷,具有无污染、选择性高、反应条件温和等优
虎舌红(Ardisia mamillata Hance)为紫金牛科,紫金牛属的矮小灌木,具有喜温耐阴的特点,可入药,具有较好的观赏价值与药用价值。本研究以红、绿虎舌扦插苗作为试验材料,以15d、30d、45d为不同周期,设置0(CK)、250mg·kg-1(T1)、500mg·kg-1(T2)、750mg·kg-1(T3)、1000mg·kg-1(T4)、1250mg·kg-1(T5)不同铅处理梯
介电材料在生活中有着广泛的应用,在电子电气,薄膜电容器等领域发挥着重要的作用。聚合物介电材料具有击穿强度高和介电损耗低等优点,但较低的介电常数和储能密度限制了其在介电领域的应用。因此,需要进一步提升聚合物介电材料的介电常数和储能密度。本文通过开环易位聚合制备了一系列侧链含有三联吡啶和金属配合物的聚合物,研究其介电和储能性。合成了单官能含金属离子配位三联吡啶侧基的降冰片烯二甲酰亚胺类单体TPNDI-
聚肽由于具有良好的生物相容性,其组装体常被用于生物医药领域的研究,聚肽囊泡就是其中一种,然而现有的聚肽囊泡通常由嵌段共聚物组装而成,均聚肽囊泡的研究尚未有人报道,且其形成机理也有待填补。此外,聚肽可以作为仿生矿化的模板与无机离子结合形成复合材料,在生物医药领域同样具有潜在的应用价值,但是现有的研究模板主要集中在含负离子的聚肽上,很少有关于含正离子或同时含正负离子的聚肽的研究。据此,我们设计合成了同