论文部分内容阅读
人类基因组上含有大量的反转录元件,其中ALU序列的拷贝数最多,在灵长目基因组上有超过100万份拷贝,约占到人类基因组总长度的10%。近来许多研究表明,ALU序列在人类基因组重组、可变剪切和mRNA转录后的修饰和调控中发挥着特殊的作用。ALU序列作为一种仍然具有活性的可移动元件,在人类遗传学和灵长目生物的基因组比对研究中也有着重要的意义。随着人类基因组计划精确图的完成,我们可以精确的获取ALU序列。本文从全基因组的角度,精确分析了UCSC hg17版本人类基因组序列上全部1,083,370个ALU元件的分布以及它们插入基因组后的插入、删除和突变情况,并且着重分析了插入在人类基因组启动子区的9601个ALU,发现了一系列具有统计学意义的结果。
筛选出24条染色体上所有的ALU序列上发生的插入、缺失和突变事件。并分别统计了这三种特征在全基因组的分布。我们的结果表明在全基因组上ALU序列的插入、缺失与ALU所处位置的GC含量有着复杂的关联。尤其是长片断缺失事件和GC含量正相关,而这种长片段的缺失可能是由于染色体的不等位重组造成,这对于人类基因组重组研究有着特别的意义。
在启动子区,ALU的分布和特征与全基因组截然不同。在富含CpG岛的启动子区域出现了明显的ALU缺失。通过进一步的研究,我们发现ALU序列右单体的缺失情况又明显比左单体严重。同时结果还显示,随着ALU在启动子区相对转录起始位点上下游的不同和所处正义链反义链的不同,ALU序列的缺失也呈现出明显不同的特征。这说明在某种程度上,启动子区的ALU序列远非一种中性序列,而是和基因的转录有着密切的关联。
2004年底有研究发现在转录后mRNA的UTR区广泛存在着一种A-I的修饰,而这种A-I修饰又绝大部分发生在插入到此区域的ALU序列上。在本文中,我们利用统计学的方法找出了5’UTR区ALU上腺嘌呤突变的高发位点,我们确信这些位点与A-I修饰有关。
这些结果的发现都反映了ALU在全基因组上存在着许多尚不为人知的角色,我们对它的研究有助于更好的理解基因组结构和非编码区功能,并为下一步开展实验提供了方向。