论文部分内容阅读
转录因子与DNA序列相结合在转录水平调控基因的表达。在真核细胞中,转录因子的结合过程是高度依赖于局部染色质结构的。真核细胞中染色质的基本结构单位是核小体,核小体及其组蛋白修饰等表观遗传因素和转录因子共同构成了真核基因转录调控的基础。转录因子结合位点周围存在特定的核小体占据和组蛋白修饰的分布模式,因此,我们搜集各种转录因子以及核小体的相关数据以系统研究转录因子结合位点周围核小体占据以及组蛋白修饰的普遍性特征,并探讨细胞特异性的转录因子结合位点预测的模型,在特定细胞中建立转录因子结合位点预测的方法。另外,转录因子结合位点处的染色质结构可能与结合位点相对于基因的位置、转录因子的功能以及转录因子的结合方式有关,分析其中的关联将有助于我们理解转录因子与表观遗传因素之间的协同调控机制。 我们系统研究了转录因子的结合与核小体占据的关系,发现转录因子结合位点的两侧存在丰富的核小体占据模式,并且这些不同的核小体占据模式与基因的表达水平有关。大部分转录因子结合位点只在一侧有较好的核小体定位,说明转录因子结合位点周围核小体的非对称分布是更加普遍的特征;大约四分之一的结合位点在两侧有较好的核小体定位,这些结合位点主要位于远离核心启动子的区域,距离转录起始位点较近的结合位点周围的核小体占据模式由于受到RNA聚合酶等因素的影响而呈现出模糊的核小体定位;还有小部分结合位点被核小体占据,说明在这些位置转录因子是结合到核小体DNA的。进一步研究转录因子结合位点所调控的目标基因发现结合位点周围不同的核小体占据模式与基因的表达水平有关。激活因子和抑制因子是与基因表达密切相关的两类转录因子。与激活因子相比,细胞内抑制因子结合位点周围的核小体定位更好,这可能是因为抑制因子的结合序列更倾向于形成核小体,在细胞内抑制因子的结合更加依赖于核小体的动态变化的缘故。深入分析激活因子和抑制因子所调控的目标基因,发现两侧核小体定位较好的抑制因子结合位点以及被核小体占据的激活因子结合位点所调控的目标基因的表达水平明显较低。这些结果将转录因子结合位点周围的核小体占据模式与基因的表达水平联系起来。 转录因子结合位点周围不仅存在特定的核小体占据模式,我们的研究结果还表明在转录因子结合位点周围存在特定的组蛋白标记信号。我们将组蛋白变体和组蛋白修饰统称为组蛋白标记。H2A.Z、H3 K4me1、H3K4me2、H3K4me3、H3K9ac和H3K27ac在转录因子结合位点两侧600 bp的范围内呈现双峰分布,并且具有强的两两相关性,说明这六种组蛋白标记主要位于转录因子结合位点两侧的两个核小体上。H3K4me1与增强子区域有关,因此,H3K4me1的双峰分布主要局限在远离核心启动子的区域。H3K79me2在转录因子结合位点一侧呈现单峰分布,并且信号最大值处距离转录因子结合位点~720 bp。H4K20me1、H3K27me3、H3K36me3和H3K9me3信号则比较发散,在转录因子结合位点处富集程度较低,但在富集位点处呈单峰分布,并且峰区域覆盖结合位点,暗示有些转录因子是结合到核小体DNA上的。激活因子和抑制因子结合位点周围核小体的占据模式差异较大,但除H3K36me3和H3K9me3之外的组蛋白标记在这两类结合位点周围却有类似的分布模式。H3K36me3和H3K9me3两种组蛋白标记在抑制因子结合位点的一侧信号较强,说明部分抑制因子可能在结合位点的一侧建立异染色质以抑制目标基因的转录。 转录因子结合位点处的染色质结构不仅与结合位点相对于基因的位置以及转录因子的功能有关,而且还与转录因子的结合方式有关。我们定义了转录因子的三种结合方式:典型结合方式、共结合方式和揽系结合方式,其中,揽系结合方式表示转录因子通过其他转录因子间接与DNA序列结合,而典型结合方式和共结合方式则基于转录因子与DNA序列的直接结合。典型结合位点和共结合位点周围存在类似的核小体占据和组蛋白标记水平,但揽系结合位点周围核小体的占据水平相对较低,H2A.Z、H3K4me1、H3K4me2、H3K4me3、H3K9ac、H3K27ac和H3K79me2组蛋白标记的水平相对较高,并且揽系结合位点更可能位于DNaseⅠ高敏感区域内。这些证据说明揽系结合位点周围的染色质结构更加开放,这可能与转录因子的远程相互作用有关。 根据转录因子与表观遗传因素调控关系的分析结果,最后我们整合组蛋白标记数据构建细胞特异性的转录因子结合位点预测模型。通过聚类或提取关键组蛋白标记的方式来处理组蛋白标记数据,并结合DNaseⅠ酶切数据在CD4+T细胞中预测转录因子结合位点可以提高预测的召回率,但预测准确率却不同程度地降低。为了保证预测模型同时具有较高的准确率和召回率,我们进一步改进了CENTIPEDE模型,用伯努利分布代替CENTIPEDE方法中的负二项分布描述组蛋白标记数据。新的模型在牺牲较小准确率的情况下使得预测召回率有很大的提高。