论文部分内容阅读
植物病原是引起植物病害的生物类因子的统称,包括细菌、病毒、真菌、线虫和卵菌等。植物病原使用不同的侵染机制感染植物,而植物则进化出相应的防御策略来抵御病原的感染。植物和病原之间的冲突导致了一场循环往复的进化“军备竞赛”,通常被称为“红皇后进化动力”(Red Queen evolutinary dynamics)。随着基因组时代的到来,很多植物和植物病原已被全基因组测序。这些全基因组数据为我们研究病原的进化以及植物抗病基因的进化提供了宝贵的资源。在本研究中,我们基于植物病原和植物全基因数据,使用比较基因组学和系统发生分析方法对基因加倍对DNA病毒进化的影响以及植物抗病基因的起源与进化进行了系统的研究。基因加倍是新基因产生的主要机制之一,在基因组复杂化方面起着重要的作用。以往研究表明RNA病毒基因组中的基因加倍较为少见,而基因加倍对于DNA病毒进化的影响还知之甚少。DNA病毒中包括了许多重要的植物病原,如花椰菜花叶病毒(Cauliflower mosaic virus)、木薯花叶病毒(Cassava vein mosaic virus)、球石藻病毒86(Emiliania huxleyi virus 86)等。我们选取了 250种病毒,代表了已知DNA病毒的所有的属。我们通过同源序列查找和系统发生分析系统地挖掘了 250种DNA病毒基因组中的基因加倍事件。我们在85种双链DNA(double-stranded DNA,dsDNA)病毒基因组中共发现612个基因加倍事件,但在40种单链DNA(single-stranded DNA,ssDNA)病毒和 9 种逆转录双链 DNA(reverse-transcribing dsDNA,dsDNA-RT)病毒基因组中没有发现基因加倍事件。我们的结果表明基因加倍在不同的DNA病毒中发生的频率不一样,基因加倍事件在双链DNA病毒中发生较为频繁。我们发现双链DNA病毒中基因加倍数目与病毒基因组复杂性(用基因组大小和基因数目来测度)成正相关,说明基因加倍是塑造双链DNA病毒基因组复杂性的一种主要机制。我们还发现27.4%基因加倍事件是串联分布的,说明串联基因加倍是双链DNA病毒中基因加倍的主要方式之一。选择压力分析表明双链DNA病毒中大多数加倍之后的基因都经历了负选择。植物中绝大多数抗病基因(resistance genes,R genes)编码核苷酸结合位点(nucleotide binding site)和富亮氨酸重复(leucine-rich repeat)结构域(NBS-LRR,NLR)蛋白。NBS-LRR蛋白可以分为含Toll/白细胞介素受体(Toll/Interleukin-1 receptor,TIR)结构域的蛋白(TIR-NBS-LRR,TNL)以及不含TIR结构域的蛋白(non-TIR-NBS-LRR,nTNL)两大类。以往研究表明R基因广泛分布于陆生植物基因组中,但关于R基因的起源和早期分化并不清楚。我们利用比较基因组学和系统发生学分析方法在24种代表性植物基因组和8个轮藻转录组中对R基因进行系统的挖掘,共发现3712个NBS-LRR蛋白。我们首次在轮藻中发现了 R基因的存在,且TNL和nTNL蛋白都存在于轮藻基因组中,TNL蛋白可能起源于nTNL蛋白通过获得TIR结构域。我们对轮藻和苔藓类植物中的34个R基因簇进行选择压力分析,发现它们中大多数都经历了正选择,说明这些植物中的R基因可能参与了植物与微生物之间的互作。TIR结构域是一类细胞内信号传导结构域,在固有免疫系统中发挥了重要作用。含TIR结构域的蛋白广泛分布在细胞生物中。本研究发现TNL可能来源于TIR结构域插入到nTNL中,但是TIR的来源并不清楚。本研究通过对植物、动物、细菌和古菌中的TIR结构域进行系统发生分析,发现植物TNL中的TIR聚在一起,表明植物TNL中的TIR是同一来源的。RPW8(resistance to powdery mildew 8)是首先在拟南芥中发现的一类广谱型抗病结构域。本研究发现含有RPW8结构域的R基因广泛分布于除单子叶植物外的陆生植物中。我们在24个代表植物基因组中系统地挖掘含RPW8结构域的蛋白,在11个植物基因组中发现148个含RPW8结构域的蛋白,其中包括127个R蛋白。我们研究也发现结构域获得和丢失塑造了含RPW8结构域蛋白的多样性。综上所述,本研究对植物DNA病毒中基因加倍事件以及抗病基因的起源和进化进行了系统的研究。本研究发现不同DNA病毒具有基因加倍事件发生的频率不同,基因加倍对塑造双链DNA病毒基因组复杂性具有重要的意义。本研究首次在轮藻中发现R基因,说明R基因的起源可能在植物登陆过程中发挥了重要的作用。本研究对我们理解植物与病原之间互作的进化具有重要的意义。