论文部分内容阅读
大约在一万年前,甘蓝型油菜(基因组为AnAnCnCn)由甘蓝(基因组为CoCo)和白菜(基因组为ArAr)异源杂交并多倍化形成。油菜的驯化历史很短,大概只有三四百年的时间,由于对不同气候和纬度的环境适应而分化为冬性、春性和半冬性三种类型。随着测序技术和方法的不断更新,群体遗传学已成为挖掘植物复杂性状关于自然变异和人工选择最有力的工具。与此同时,新一代测序技术的出现使得基因分型的成本越来越低,加上白菜、甘蓝和甘蓝型油菜基因组序列和注释信息的释放,利用组学的数据对甘蓝型油菜遗传结构和选择驯化的研究将越来越受到关注。本研究利用国际芸薹属联盟开发的新一代测序技术Brasscia SNP 60K基因芯片对327份从全世界收集的不同来源的油菜进行基因分型,随后又结合101份油菜叶片的转录组测序数据和拟南芥的Microarray数据对甘蓝型油菜遗传结构和选择驯化进行研究,最终目的是想阐明油菜适应不同环境和地区的分子机制。该研究对于挖掘油菜种质资源的潜力,增强油菜品种的适应性具有重要的理论和实践意义。研究结果主要有以下几个方面:一、甘蓝型油菜遗传结构和核苷酸多样性分析1.全基因组水平的连锁不平衡(LD)和遗传结构分析本研究利用过滤后的SNP数据(32641个SNP标记)在全基因组水平对所有材料进行连锁不平衡(LD)分析,结果显示,当LD衰退到最大值一半时,衰减距离大约为150 kb,这和其他一些自交作物的衰退基本一致。另外,当r2=0.1时,A亚基因组的衰退距离为0.35-0.4 Mb,而C亚基因组的衰退距离为3.5-4 Mb,说明甘蓝型油菜A亚基因组发生了更多的重组,使得衰退距离显著小于C亚基因组。重组的发生会打破LD,所以本文将那些容易发生重组,LD相对也低的区域称为LD热点;相反,则称为LD冷点。通过全基因组水平的LD热点和LD冷点研究发现,78.16%的LD热点分布在A亚基因组而72.59%的LD冷点分布在C亚基因组。另外,LD热点区间的基因密度是冷点区间的2倍多,GC含量也多于冷点区间,但是冷点区间内含有更多的转座子,这和LD反映的结果一致,都说明了油菜A亚基因组的遗传变异更加丰富。2.群体结构和遗传多样性分析为了从全基因组水平比较三个生态型的不同,本文基于过滤后的SNP数据对所有材料进行群体结构和遗传多样性的分析。群体结构和PCA清晰地将所有材料分为冬性、春性和半冬性三个亚群,并且材料相互之间有遗传渗透,尤其是半冬性材料中渗入了很多的冬性和春性遗传成分。三个生态型组合的遗传多样性和LD分析说明,半冬性材料在A亚基因组有更高的核苷酸多样性(π)和更快的LD衰退距离,说明中国半冬性油菜从欧洲引入亚洲后导入了油菜的亲本之一白菜的遗传成分,拓宽了半冬性油菜A亚基因组的遗传多样性,导致半冬性油菜在A亚基因组上的遗传距离增加,LD衰退加快。3.群体扩张分析在油菜的育种过程中,研究发现遗传多样性有所丢失,但群体中低频等位基因不断累积,所以本文通过稀有SNP的变化来研究不同生态型油菜的群体扩张现象。研究发现,半冬性油菜组合在每条染色体上的稀有SNP数目都显著多于冬性和春性油菜(T测验,p=5.17×10-7),同时半冬性油菜稀有SNP分布的区间内Tajima’s D值显著小于0,这说明半冬性油菜在上世纪30-40年代从欧洲直接或间接通过日本引进中国后,正在经历群体扩张,而且这种扩张还在继续。二、不同生态型油菜的群体分化和选择信号研究1.不同生态型油菜组合间的群体分化(Fst)研究冬性(W)、春性(S)和半冬性(SW)油菜在春化、开花等环境适应性方面存在明显的差异,本文首先通过Genepop v4.2软件计算三个生态型组合(S-W, W-SW和SW-S)的Fst值,接着利用滑动窗口分析对Fst值进行优化,结果表明,冬性和半冬性油菜群体之间的平均分化程度最大(Fst=0.235),春性和半冬性油菜群体之间的平均分化程度最小(Fst=0.173)。并在顶部5%的Fst群体分化区间,本文发现一些与适应性相关(比如开花期,黑胫病抗性及菌核病抗性等)的基因和QTL,这些结果可为将来不同生态型油菜的群体分化研究提供依据。2.中国半冬性油菜组合(SW)与欧洲冬性和北美春性油菜组合(W&S)的选择信号研究油菜从欧洲引入中国不到一百年的栽培历史,由于瓶颈效应的影响和本地白菜型油菜遗传成分的导入,中国半冬性油菜(SW)与欧洲冬性和北美春性油菜(W&S)在抗性、品质和开花行为等方面都有明显的不同。基于以上现象,本文对这两组不同类型的油菜进行群体分化和选择信号的研究,本文将顶部5%的Fst群体分化区间内的基因通过在线软件agriGO进行基因富集分析,结果显示SW与W&S组合的差异基因主要富集在响应春化、硫苷代谢进程、油脂代谢进程、顶端分生组织的发育调控、开花、昼夜节律的调控和水杨酸介导的信号途径等生物学进程。另外,本文通过顶部5%的Fst和核苷酸多样性的比值(πSW/πW&S)的交集来衡量选择信号,结果表明,在W&S组合选择信号区间A09上检测到一个与黑胫病抗性相关的QTL,在SW选择信号区间C06上发现一个与菌核病抗性相关的QTL,这反映了不同生态型油菜适应当地环境后表现出对病害抗性的不同选择。3.冬性和春性油菜的差异分析本文通过两种分析方法(第一种同上利用Fst分析,第二种通过GSAA软件)对冬性和春性油菜的差异基因(顶部5%的Fst群体分化区间)进行富集分析,二者共同富集在响应刺激、防御反应和开花行为这三个生物学进程,这同样反映了不同类型油菜对环境的适应性。4.冬性和春性油菜开花期的全基因组关联分析(GWAS)为了研究冬性和春性油菜开花差异的内在因素,减少环境等地域的影响,本研究将60份冬油菜和71份春油菜种植于中国半冬性环境下,对开花期性状进行GWAS分析。为了控制开花期表型数据,本文进行了最佳线性无偏预测(BLUP)矫正,最后通过Tasselv5.0软件对矫正后的数据通过PCA+K模型进行GWAS分析。结果在A02、A03、A09和C08染色体上共检测到38个显著的SNP位点,解释的变异的从5%到28%。其中C08显著SNP区间(35.01-35.38 Mb)与A09上显著SNP区间(30.00-31.21 Mb)是同源的。另外,除了A02上显著位点附近有一个开花基因FLC,其他的位点都是新发现的,在前人研究的开花期QTL和基因中未被检测到。这些位点可能是冬性和春性油菜适应中国半冬性环境后,表现出与环境相适应的位点,结果还需要进一步的实验验证。5.不同作物开花基因FT的保守性分析本文利用Lu等(2014)的转录组测序数据和Des Marais等(2012)的Microarrays表达量数据进行生物通路富集分析,最终发现冬性和春性的差异基因与植物H3K27me3调控机制有关,该机制参与植物的春化反应,并对FT基因进行调控,随后对FT基因的结构分析,发现不同物种在生态型开花适应性方面,存在基因保守性现象。