论文部分内容阅读
随着高通量多组学技术的迅猛发展,生物学家已经鉴定了海量的疾病候选基因。这些基因关系着疾病的发生,发展和治疗过程。然而,由于这些基因获取过程中可能受到噪音和样本偏倚的影响,使得现有的疾病候选基因中,往往存在大量的假阳性或冗余信息,阻碍我们对疾病发生机制的更进一步认识。因此,定量刻画疾病候选基因在不同疾病环境下的调控能力大小,并对这些基因进行优先级排序,对于理解疾病发展进程以及开发相应的干预策略都有着至关重要的作用。传统用于寻找疾病关键基因的方法往往着眼于静态的全局蛋白互作组,而忽略了不同疾病环境造成的分子间互作关系的差异,以及同一基因在不同环境下可能发挥完全不同生物过程这一事实。因此,在本研究中,我们基于复杂疾病分子系统的混乱度理论,提出了疾病网络熵这一概念,并基于此刻画不同疾病环境下疾病候选基因的调控能力,系统阐述了其在疾病共发生,药物重定位以及中药机制研究方面的应用。首先,我们基于有向的蛋白互作网络,为274个疾病构建了它们特异性的基因调控网络,用于模拟它们特异性的疾病分子环境,并构建复杂疾病网络熵理论。接着,我们提出了基因网络熵方法(NOGEA)用来对每个疾病候选基因的调控能力排序,推断关键调节基因。利用现有数据库中与疾病发生和发展相关的基因数据,我们发现NOGEA推断出的关键基因也参与了疾病的发生和发展过程。通过与其他类型的疾病候选基因排序算法作对比,我们证明了NOGEA方法是一种可靠的疾病关键基因推断技术。阐明疾病的共发生机制对理解疾病的发展有重要作用。为了进一步证明疾病网络熵理论的可靠性,我们可以将疾病候选基因分为关键型,过渡型以及冗余型三种,用来研究该理论在疾病共发生中的应用。通过与真实的疾病共发生网络对比,我们发现仅用关键型基因推断的疾病-疾病关联网络对疾病共发生关系预测效果最好,甚至优于使用全部疾病候选基因构建的疾病-疾病网络。这说明利用基因熵值对疾病基因进行优先级排序可以在一定程度上去除疾病基因中包含的噪音信息。接着,我们发现利用不同疾病之间共同的关键基因或互作关系可以很好的解释疾病共发生的机制。最后,我们利用疾病关键基因初步分析了酒精中毒导致帕金森的可能分子机制。为了研究疾病网络熵在药物重定位方面的应用,我们定义了药物扰动熵(DDE)这一概念,用于刻画每个药物对特定疾病的潜在治疗效果。我们发现通过药物扰动熵的刻画,可以准确的从海量的药物-疾病关系中,识别出已知关系。并且,其准确率显著的高于几种常见的用于预测药物-疾病关系的方法。通过该方法,我们解释了几种用于胰腺癌治疗的药物的潜在作用机制,发现高效的治疗药物更倾向于靶向疾病关键基因在互作网络上的局部模块。进一步,基于该方法,我们从FDA批准的药物中,筛选了11个可能用于治疗胰腺癌的老药,并通过体外抗胰腺癌细胞实验进行了验证。通过RNA测序分析,也证明了我们关于药物靶向关键基因局部模块的假设。最后,基于疾病网络熵理论,结合系统药理学分析框架,筛选了用于抗胰腺癌的草药仙鹤草,并分析了其潜在分子机制。我们发现仙鹤草中的主要活性成分槲皮素,木犀草苷,百秋李醇等可能通过调节胰腺癌的代谢过程和生长因子来控制胰腺癌细胞的增殖,并通过控制趋化因子以及神经营养因子信号通路阻断胰腺癌对神经系统的侵袭。此外,仙鹤草中的活性成分对免疫调节也有一定作用。这些结果说明,仙鹤草可能在胰腺癌的发展的不同阶段,通过重塑胰腺癌的代谢和免疫微环境达到治疗胰腺癌的目的。总之,疾病网络熵理论是我们基于疾病分子系统混乱度,提出的用于挖掘疾病特异性关键基因的新策略。其在疾病共发生,药物重定位,中草药作用机制等多个方面的成功应用,为人类复杂疾病相关研究提供了新的思路。