论文部分内容阅读
网络建模已被证明是分析细胞内部工作原理的基本工具。人们对生物过程的理解已经被彻底改变,并且在疾病生物标志物的发现方面取得了很大进展。研究者已经致力于使用由高通量技术产生的功能基因组数据集来重建各种类型的生物化学网络。 基因共表达网络作为基因调控网络的一种,它由基因作为节点,基因间的相互作用关系作为边。它可以用于寻找枢纽基因和基因模块中的关键基因从而发现新的致癌基因、癌症亚型等,并且为医学等方面的研究提供帮助。许多生物学研究领域如药物设计需要基因调控网络,以提供对活细胞中细胞过程的清楚的认识和理解。这是因为基因及其产物之间的相互作用在许多分子过程中起重要作用。基因调控网络可以作为研究人员观察基因之间关系的蓝图。由于其重要性,已经提出了几种计算方法以从基因表达数据推断基因调节网络。DNA,RNA,蛋白质和代谢物之间的复杂的调节关系网络调节生物体如何实现表型和功能。基因共表达网络,与差分相关分析一起,提供最通用的基因相互作用探索工具,使用基因表达模式,以确定潜在的关联和模块化的基因相互作用和网络之间的差异关联。结合不同类型的生物数据的网络可以帮助将整个生物信息的复杂性降低为离散的和可解释的数据片段,它们是假设构建和测试的起点。 从基因表达谱中鉴定条件特异性子网具有重要的生物应用,它的范围从选择疾病相关生物标记到发现跨不同表型的通路改变。虽然存在许多用于提取这些子网络的方法,但是同时考虑单个基因的差异表达和基因对的差异相关性的现有方法却非常少,并且容易丢失数据中潜在的有价值的信息。 在本文中,我们提出了一种新的差异性子网搜索算法,它采用联合测量“节点”(个体基因)和“边”(基因—基因共表达)的条件特异性变化的评分函数。它使用遗传算法来搜索使得评分函数最大化的单个最佳子网络。我们将该算法应用于具有各种差异表达模式的模拟数据集和两个真实数据集,第一个来自病态肥胖患者的跨组织比较,另一个来自HapMap样品的跨人口群的比较。与以前的方法相比,该方法更稳健地识别适当大小和有意义的生物相关性的子网络,具有更重要的生物意义。