论文部分内容阅读
MicroRNAs(miRNA)是一类长约21~24nt的小分子RNA。miRNA具有重要的调控基因表达功能,可降解靶基因的mRNA或抑制蛋白质的翻译。但目前对于miRNA基因本身的转录调控知之甚少。由此,我们通过系统分析植物miRNA在基因组上的分布结构、pri-miRNA、miRNA启动子、调控miRNA的转录因子等各方面的信息,建立了植物miRNA基因组学数据库pmiRGD (plant miRNAGenomics Database),以期为深入理解MIRNA基因转录过程的调控机制提供全方位信息支持。Intronic miRNA位于其它转录单元(宿主基因)的内含子内,与靶基因、宿主基因之间存在复杂的调控关系。而植物intronic miRNA的研究却非常少。我们以模式植物拟南芥、水稻为例,系统分析了植物intronic miRNA的特征、表达特性和功能。这些信息将推进植物intronic miRNA的研究。本研究的主要结果如下:(一) miRNA基因组学数据库pmiRGD的构建(1) miRNA前体序列和基因组序列的获取:18种植物的9299个miRNA前体序列来自miRBase、PMRD数据库,以及近期的文献;相应植物的基因组注释信息来自TAIR10、RGAP6.1、及phytozome6.0等植物基因组数据库。(2) miRNA与其它转录单元的位置关系分析:利用BLASTN将pre-miRNA完全匹配到基因组,及相关注释基因或内含子内上,寻找miRNA的宿主基因。共有7255个pre-miRNA完全匹配到基因组上7940个互不重叠的位置及相应的宿主基因,其中约10%的miRNA定位于其它转录基因的内含子内。(3)miRNA簇:位于同一宿主基因有义链上的miRNA为同一基因簇,67个基因内miRNA位于32个miRNA簇;其它位于基因组的同一条链上,分别以1kb、2kb、3kb为最大间隔距离(MID)确定为同一基因簇,724个基因间miRNA位于318个miRNA簇(MID=3kb)。(4)pri-miRNA:通过广泛的文献检索,共获得拟南芥、玉米中,127个MIRNA基因的328个RACE验证的pri-miRNA。此外,BLASTN结果中,969个miRNA分布于941个宿主基因的有意义链上,这些宿主基因的mRNA也作为相应miRNA的原初转录物(pri-miRNA)。(5)转录起始位点确定及启动子序列获得:根据pri-miRNA确定miRNA基因的转录起始位点(TSS)。获取TSS上游最长1kb范围内的基因间序列作为启动子。对其它未确定TSS的miRNA,获取pre-miRNA上游最长2kb范围内的基因间序列作为启动子。(6)转录因子结合位点(TFBS)鉴定:利用P-Match和TF-scan两个程序分析miRNA启动子区域内可能的TFBS。P-Match利用TRANSFAC6.0植物启动子元件数据库为基础进行预测;TF-scan利用Megraw等人构建的99个转录因子结合位点序列的矩阵进行预测。在miRNA的启动子上发现了大量的转录因子结合位点。(7)miRNA的表达模式分析:利用植物小RNA高通量测序的数据,分析miRNA在不同发育阶段、不同组织的表达模式。目前pmiRGD仅提供水稻和拟南芥miRNA在根、地上部、花中的表达模式。PmiRGD数据库网页使用Microsoft Visual Studio2008编写,Access2003数据库存储数据,系统运行在Windows2003服务器。网页设计简洁易用,免费对用户开放,网址:www.plantmirgo.org.(二)拟南芥、水稻intronic miRNA特征分析(1)从已有的数据库(miRBase v18、PMRD v1.0)和文献中,共获得1495(拟南芥)和2760(水稻)个pre-miRNA序列。利用BLASTN发现了37个拟南芥和181个水稻intonic miRNA位于蛋白编码基因的内含子。分别选取16个(拟南芥)和10个(水稻)intronic miRNA进行RT-PCR实验,证明了这些miRNA来源于真正的内含子。(2)基因结构分析发现,拟南芥2个intronic miRNA位于同一个基因簇;水稻13个intronic miRNA分别位于6个miRNA簇。这些位于同一基因簇的miRNA大多来自不同的基因家族,暗示它们可以作用于不同的靶基因。同时,染色体定位分析表明,拟南芥73%(27/37),和水稻55%(99/181)的intronic miRNA定位于基因组片段复制区域,这暗示了基因组或染色体的片段复制事件可能对于intronic miRNA的起源和进化起到了非常重要的作用。(3)含有miRNA的内含子长度分析结果显示,拟南芥79.2%的的内含子小于1kb(最大3298bp)。91.7%的pre-miRNA上游序列小于1kb。水稻83%的内含子小于3kb(最长12626bp),71.4%的上游区域小于1kb。这些数据说明植物的内含子比较小。取内含子范围内miRNA的上游序列进行启动子预测,拟南芥1个(1/37)、水稻14个(14/181)内含子预测到有启动子存在。由此可见,植物中较小的内含子和少数可能的启动子,暗示大多数intronic miRNA在宿主基因内部不存在独立的转录单位。(4)经MPSS数据库分析发现,拟南芥的19个、水稻的48个intronic miRNA检测到了表达,这说明intronic miRNA是真实表达的。利用Genevestigator数据库,分析宿主基因在植物不同发育阶段的表达模式。结果显示,大多数基因在几乎所有的发育时期都表达,且有较高的表达水平。另外,发现了拟南芥1个基因、水稻26个基因只在植物发育的某一个或两个阶段特异表达。宿主基因的这些表达特性,暗示了与其共表达的intronic miRNA在植物生长发育过程中重要作用。(5)利用降解组测序数据,鉴定了拟南芥13个成熟体intronic miRNA的41个靶基因及水稻148个成熟体intronic miRNA的494个靶基因。并且有一些靶基因是功能非常重要的转录因子。这也显示了intronic miRNA参与的基因表达调控途径的重要性。