论文部分内容阅读
开花是植物从营养生长到生殖生长的一个重要转折点,直接影响着种子植物生育期的早晚、授粉及种子发育的最佳时期。通过对模式植物拟南芥(Arabidopsis thaliana)的分子遗传学研究,确定至少存在4条调控开花时间的信号途径,即光周期途径、春化途径、自主途径和赤霉素途径。甘蓝型油菜是拟南芥的近缘种,由芸薹属二倍体物种白菜或白菜型油菜(Brassica rapa, AA,2n=2x=20)和甘蓝(Brassica oleracea, CC, 2n=2x=18)通过天然种间杂交后再经染色体加倍而形成的异源四倍体物种。近年来,十字花科拟南芥与芸薹属物种的比较基因组学研究表明,大约在20百万年前拟南芥与芸薹族物种分化,随后大约在16百万年,芸薹族祖先种基因组发生了基因组水平的三倍化,即白菜、甘蓝等芸薹属二倍体物种由一个六倍体的芸薹族祖先衍化而来。对白菜和甘蓝全基因组的分析发现,全基因组三倍化后亚基因组间发生了大范围的基因丢失(称为三倍化过程),同时在多种植物中的研究表明某些类别的基因丢失得相对少些,一些保留的多拷贝基因发生组织表达分化。那么,芸薹属中开花时间相关基因在基因组三倍化后是否优先保留,保留的多拷贝基因的表达是否发生了组织分化?这些问题尚没有报道。本研究利用白菜和尚未发表的甘蓝及甘蓝型油菜全基因组序列,在基因组范围进行了系统的比较分析,同时,以光周期调控途径中的关键基因CONSTANS(CO)为例,分析了该基因在不同开花期甘蓝型油菜品种中的表达动态,以期帮助了解基因控制开花时间的规律。获得的主要研究结果如下:1.白菜、甘蓝及甘蓝型油菜全基因组中开花时间控制基因的鉴定和进化1.1白菜、甘蓝及甘蓝型油菜全基因组中开花时间控制基因的鉴定根据前人的研究,整理获得了拟南芥开花时间控制基因共211个。根据基因的结构域结合Blast,鉴定出白菜全基因组中开花时间控制基因383个,甘蓝385个,甘蓝型油菜667个。从拟南芥到白菜、甘蓝再到油菜,基因数目随基因组的加倍而发生了扩张。与拟南芥比较,基因扩张倍数分别为:白菜为1.95倍,甘蓝为2.01倍,甘蓝型油菜为3.30倍。甘蓝型油菜是白菜和甘蓝杂交加倍而成的异源四倍体,但其开花时间控制基因不是白菜和甘蓝的二者之和,而是后者的0.87倍。这些结果表明,从拟南芥到白菜、甘蓝再到油菜,在每次的基因组加倍后的基因丢失过程中开花时间控制基因都有丢失,但丢失的比例远低于其它类别的基因,其中保留的2和3拷贝(paralogous)基因比例远高于基因组的平均水平,这些结果说明了这类基因在物种进化过程中的重要作用。1.2开花时间控制基因在白菜和甘蓝基因组上的分布在白菜和甘蓝基因组组装的片段中有73%-80%被锚定到遗传/物理图谱上,从而形成了10条和9条染色体。本研究的383个白菜基因有373个基因定位到这10条染色体上,甘蓝385个基因312个基因定位到9条染色体上,且两个物种中均是第3染色体上分布的基因最多。其余的基因分布在没有锚定的基因组组装片段上。物种间基因组共线性分析已将拟南芥、白菜、甘蓝基因组中的大部分基因划分在24个(用A到X表示)保守的祖先基因组块上。在所鉴定的所有开花基因中,314个白菜和307个甘蓝开花时间基因落在这24个共线性区段上,可看出大部分基因(314/373和307/312)落在保守的共线性块上,其中在U,R,J三个区段中的分布较其它区段更高;这些结果进一步说明了开花基因的进化保守性或功能必要性。1.3 Gene Ontology (GO)的功能和富集分析白菜开花时间相关基因有85类GO term,933个GO号,甘蓝开花时间相关基因有93类GO term,978个GO号,甘蓝型油菜开花时间相关基因83类,GO term 2022个,涉及到细胞组分、生物学过程和分子功能三大方面;以基因组基因为背景,分析开花时间相关基因的富集,结果表明,白菜、甘蓝、油菜等芸薹属植物相对基因组而言,开花时间控制基因富集的功能是一致的。1.4保留的多拷贝基因结构变异分析对开花时间相关基因多拷贝间结构比较,结果表明,部分开花时间基因在白菜、甘蓝多拷贝间存在结构变异,表现在外显子数目及结构域等的差异上,且对应的表达有差异。对开花时间基因的GO注释上有差异的多拷贝间进行结构比较,结果表明,基因对表现出结构上的变异,相应的表达上也有差异。说明了基因组复制后部分保留的基因多拷贝间结构发生了变异,这可能是基因组复制后演化出新功能的重要原因。1.5开花时间基因的进化分析拟南芥与白菜和甘蓝基因对的Ka、Ks和Ka/Ks值表明,白菜和甘蓝开花时间基因在进化过程中受到负选择,在四条代谢途径中,白菜和甘蓝所受到选择压力略有差异但不显著。说明二者的进化规律是一致的。2.白菜和甘蓝开花时间控制基因在器官间的表达分化383个白菜开花时间基因在6个组织中至少一个组织中有表达的有375个,甘蓝385个基因中至少一个组织中有表达的为373个;白菜、甘蓝多拷贝基因对间表达为一个拷贝表达,共同表达和互补表达三种模式,且其表达表现为组织特异性和表达分化,说明经过基因组复制后部分保留的多拷贝基因发生了功能分化。旁系同源(paralogous)基因表达分化的一个主要形式是它们的可变剪切体(AS)的分化,已被视为一个重要的基因调控层次。开花时间相关基因在白菜和甘蓝中均有多个可变剪切体(每个基因平均2-3个AS),且存在可变剪切分化。进一步从基因调控层次说明了多拷贝基因间功能的分化。3.甘蓝型油菜CO同源基因克隆和表达分析分别从甘蓝型油菜早熟品系D626-6和晚熟品系D125-5中克隆到CDS区为1101bp的CO同源序列(早熟A-CO-1,晚熟B-CO-1);对测序结果分析表明,两个克隆片段都与已知CO基因具有很高的同源性;克隆的早熟A-CO-1和晚熟B-CO-1具有3个碱基和1个氨基酸位点的差异,氨基酸差异位点发生在B-box功能区域内,这种差异是否与油菜熟期的早、晚特性有关,我们还在进一步研究中。CO基因在甘蓝型油菜中的动态表达(1)CO基因在各组织中的表达:CO基因在各组织中都有表达,且在抽薹期和初花期相对表达较高,由此推测CO基因的积累与油菜开花有关;CO基因在不同组织中的最高相对表达量都表现为早熟品系D626-6高于晚熟品系D125-5。(2)CO基因在各生育时期的表达:CO基因在早、晚熟材料中的抽薹期Ⅱ、现蕾期、初花期、终花期的叶中的表达最高;在抽薹期Ⅰ,晚熟品系D125-5叶中的相对表达最高,早熟品系D626-6花蕾中的表达最高;在盛花期,早熟品系D626-6中CO基因在叶中的相对表达最高,晚熟品系D125-5在花蕾中的表达最高;CO基因在不同熟期材料的不同生育时期的相对表达量均表现为上午或下午取样时间高。(3)CO基因在早、晚熟材料间的表达差异:早熟品系D626-6抽薹期Ⅱ(开花前)和初花期,上午叶中CO基因表达量均明显高于晚熟品系D125-5;中午叶中CO基因表达量均高于晚熟品系D125-5;但下午叶中CO基因表达量均明显低于晚熟品系D125-5。这些结果表明了CO的动态表达调控着开花进程。