论文部分内容阅读
真核生物基因组中位置相邻的基因趋于具有相似的表达模式(共表达),然而其内在机制仍不清楚。首先我们发现在前人的研究当中,对于相邻基因的方向(→→/←←,←→,→←)和距离对共表达的影响并没有一致的结论,而这个结论对于研究共表达的机制非常重要。通过比较,我们发现可能是各文献所采用的数据和方法不同导致这种差异。针对这个问题,我们收集了多组具有可比性的表达数据集,采用统一的分析方法,对酵母、线虫、拟南芥、果蝇和人中的相邻基因共表达与方向和距离的关系进行了重新分析。我们的结果表明在多数表达数据集中,当5端距离相同时,各物种不同方向的相邻基因对的共表达没有显著差异。而在所有的数据集中,共表达随距离增大而减小。这个结果表明主要是基因的距离而不是方向决定了真核生物相邻基因的共表达。通过函数y=a/x+b拟合共表达与距离的关系曲线,我们发现参数a随着基因组规模的增大而减小。这意味着相邻基因的共表达可能随着物种进化而不断演化。
接下来我们分析了两种主要的表达调控机制--特异性转录因子的调控和染色质的调控对酵母相邻基因共表达的影响。我们发现相邻的基因比不相邻的基因具有更相似的转录因子和染色质修饰模式。但是当把这两种调控的相似性分别控制在同一水平时,相邻的基因仍然展示了比不相邻的基因更高的共表达,这意味着转录因子调控和染色质修饰模式都不能单独的解释相邻基因的共表达,但即使将这两种调控因素综合起来,也只有少数相邻基因的共表达能被解释。
再接着,我们利用自相关分析和组合谱考察了酵母全基因组中相邻基因之间同一组蛋白修饰的相似性,我们发现很多修饰在相邻基因特别是同向的相邻基因上展示了相似的占有率水平或者变化。但是这种相似性被限制在相邻的1-2个基因。而且,虽然基因的表达变化与其相邻基因的修饰变化相关,但是显著的相关也只局限于相邻1-2个基因。利用一个隐马尔可夫模型,我们识别2000多个乙酰化一致变化(共乙酰化)的染色体区域,相当多的这些共乙酰化区域包含2-4个基因。在同一区域内的基因对具有很高的共表达,而且共享了相似的功能。这些结果表明酵母的组蛋白修饰在染色体上一般只能形成小的修饰区域,这些区域一般只能对基因与其周围的1-2个或者10kbp以内的邻居的共表达起作用。这个结论至少在酵母中修正了一般认为的组蛋白修饰能在很远距离的区域(100kbp)影响基因表达的认识。
最后,针对前人的研究中忽略转录因子与DNA弱相互作用调控表达的问题,我们提出了一种新的模型--转录因子扩散模型来解释相邻基因的共表达。在这个模型中,我们假设转录因子能从它的强结合位点扩散到周围弱结合的位点上,使得相邻基因被同一个转录因子调控而导致相似的表达。我们发现对于大多数转录因子,其强结合位点周围的弱结合位点数目显著的高于随机水平,但是只有少数的转录因子的弱结合能控制基因的表达,而同时满足这两个条件的转录因子只有7个。我们还发现强结合位点与弱结合位点相邻时,它们控制的相邻基因的共表达与强结合位点与不结合的位点相邻时所控制的相邻基因的共表达没有显著差异。这个结果表明目前的分析仍不能提供足够的证据支撑转录因子扩散模型对相邻基因共表达的作用。
综合我们的结果表明,真核生物相邻基因共表达的机制比我们想象的复杂的多,目前提出的这些机制似乎都不能单独的解释这种共表达,多种因素结合起来的分析方法可能才是解决之道。