论文部分内容阅读
番木瓜(Carica papaya L.)是一种富含营养又多产的热带水果,是研究性染色体进化的模式植物。番木瓜环斑病毒(Papaya Ringspot Virus,PRSV)导致的番木瓜环斑病毒病是一种分布最广、危害性极大的番木瓜病害,严重制约番木瓜产业的发展。发展番木瓜转基因抗病品种已成为控制该病害传播最有效的手段。转基因在我国是一个公众关注事件,转基因材料对其遗传背景有多大的影响,这一直是当前社会关注的热点问题。番木瓜是最早进行转基因的作物之一,它所利用的遗传转化方法为基因枪法。基因枪轰击会造成细胞核内DNA双链断裂,在DNA双链修复过程中目的基因及其载体片段会随机插入,这个过程极有可能导致染色体重组、DNA缺失或基因突变等非目标改变。目前尚未有研究基因枪转化对番木瓜全基因组结构和功能影响的相关报道。本研究的目标是应用全基因组重测序和转录组测序等高通量测序手段(Next-generation sequencing,NGS)分析转基因番木瓜品种“SunUp”与其非转基因番木瓜受体品种“Sunset”全基因组结构与功能的差异,为评价转基因番木瓜以及相关农作物安全性提供依据。自发突变(20年分开栽培引起的)、转基因突变(基因枪轰击转化直接引起的)以及体细胞无性系突变(转化后的组织培养引起的)是导致转基因番木瓜“SunUp”异于其非转基因亲本“Sunset”的三大因素,但现有的理论和技术还无法让我们在基因转化造成的全基因组突变中区分出这三种突变各自的影响。针对上述问题,我们采用传统实验手段、高通量测序技术与生物信息学相结合的方法进行以下三个方面的探索。首先,我们评估了番木瓜微卫星标记(simple sequence repeat,SSR)在减数分裂中自发突变率的大小,以及这些自发变异标记的分类、分布情况和突变类型,深入探析自发变异标记在物种多样性和植物进化中的作用及潜在机制,也让我们对番木瓜在自然条件下突变的发生概率有更直观的了解;紧接着,通过对非转基因番木瓜亲本“Sunset”进行重测序,我们比较了基因转化前后番木瓜基因组结构的变异情况。通过比较自发突变和转基因后番木瓜基因组的突变率,能够间接评估何种突变是造成转基因番木瓜基因组结构变异的最主导因素;最后,通过对基因转化前后番木瓜品种的全转录组测序,分析揭示了基因转化后番木瓜全基因组基因表达的变化和生物学途径的改变。本研究从全基因组结构和功能水平对转基因番木瓜的生物安全性给予了正面的评价。主要研究结果如下:1.番木瓜SSR自发变异标记研究在前人一个基于SSR标记构建番木瓜遗传图谱的研究中发现,F2代中有37个SSR标记发生了突变并在电泳中呈现出明显的非亲本条带,研究发现它们全都属于class Ⅰ类(≥20 bp)。为了进一步研究这些非亲本型SSR标记的突变特征及其在番木瓜基因组中的分布情况,本研究克隆并测序了其中7个SSR标记在子代和亲本中的序列。SSR重复单元(repeat motif)数量变异是造成SSR在子代中发生突变的主要原因,其次是点突变(single nucleotide polymorphism,SNP)和小的插入/缺失(small Insertions/Deletions,smallInDel)。这种SSR高突变标记的发生率大约为每一次减数分裂3%。在7个标记中,有2个标记在亲本之间没有长度多态性但在F2子代发现了SSR长度与亲本相异的突变;仅有4个标记在亲本间具有SNP多态性,转换(transition,Ts)和颠换(transversion,Tv)比为 2:1(Ts/Tv=2:1)。与亲本之间的SNP多态性相比,总共有6个标记在亲本和子代间具有SNP多态性,而且SNP差异数目也有所增加,Ts/Tv 比例为1:1,这暗示了在减数分裂过程中存在高频率颠换突变。我们利用高通量测序技术在第二个F2作图群体中验证这些变异标记在不同群体的保守性,结果表明43%的变异标记在减数分裂中仍发生了变异。重复单元串联次数的变化是这些微卫星标记自发变异的主要突变类型,复制时滑动链错配可能是引起这些突变的潜在原因。这些变异标记在不同群体中的高保守性表明了高突变class Ⅰ微卫星标记能使基因组在短短一两代中产生遗传变异,这些变异是遗传多样性的基础,它能提高物种在自然选择中的适应性,推动物种进化。2.基因枪转化后番木瓜基因组结构的变异我们借助二代测序手段全面比较了转基因抗PRSV及其非转基因亲本之间的全基因组结构差异,包括了单核苷酸多态(SNP)、小片段插入缺失(small InDel)、大的结构变异(structural variation,SV)以及核细胞器序列(nuclear organelle DNA,norgDNA)整合和流通的差异。通过对非转基因番木瓜“Sunset”全基因组双端重测序,共获得了 7 417万条125 bp双端测序的高质量reads,总数据量为9.197 Gb,测序深度为24.72×,共检测到了 310 364个SNPs,34 071个small InDels和1 200个SVs,覆盖番木瓜9条染色体,大部分变异落在基因间区,仅有0.27%(1454个)对基因的表达水平或蛋白功能具有潜在高突变影响,GO功能富集显示这些潜在高突变基因中与ATP催化相关的基因最为丰富。全基因组SNP突变率大概为0.084%,占主导地位的SNP突变类型为G/C→A/T,转换和颠换比为1.439。种种迹象表明,转基因番木瓜“SunUp”的大部分SNP突变很可能是由自发突变引起的。我们研究了 norgDNA在基因转化前后的整合情况,结果表明,“SunUp”核基因组中共有3 430个核叶绿体(nuclear plastid DNA,NUPT)整合位点以及2 764个核线粒体(nuclear mitochondria DNA,NUMT)整合位点,分别高于“Sunset”中的 NUPT或NUMT整合位点数量。在全部norgDNA中,高达95%的整合位点为“SunUp”与“Sunset”核基因组共同所有,这表明了 norgDNA在番木瓜基因组的广泛分布,并且在基因转化前后高度保守。“SunUp”特有norgDNA序列与相应细胞器序列的相似性高于“SunUp”-“Sunset”共有的norgDNA与相应细胞器的相似性。“SunUp”外源片段的六个norgDNA侧翼与相应细胞器序列相似性高达98.18~100%,除了 NUMT侧翼,都高于这些侧翼序列与“Sunset”norgDNA的相似性。对比对的“Sunset”PE reads进行距离评估,未发现任何一对PE reads之间的距离大于外源插入序列的长度。综上,我们推测转基因过程中有部分序列从叶绿体或线粒体基因组新转移过来,这些侧翼norgDNA就属于新转移序列的其中一员。通过本研究我们了解了自发变异对转基因番木瓜“SunUp”基因组的重要影响,为分子育种提供了重要的标记资源,也认识了基因转化过程会加速细胞器DNA向核基因组迁移的频率和数量,为植物基因工程的发展提供了新的理论基础。3.转录组分析揭示基因转化后番木瓜全基因组表达的变化以转基因抗环斑病毒番木瓜“SunUp”品种及其非转基因易感病亲本“Sunset”品种的健康嫩叶为供试材料,通过转录组测序手段比较和分析了在基因转化前后番木瓜基因组转录本表达情况。总共检测到了 20 700个基因转录本,发现有842个差异表达基因(differentially expressed genes,DEGs),它们随机分布在番木瓜染色体上。GO富集分析显示了这些DEGs在微管相关基因分类(microtubule-related categories)高度富集。这两个品种在转录因子基因、转运蛋白基因以及激素合成相关基因的表达上差异特别显著,大部分注释到这三类基因家族的DEGs在转基因品种“SunUp”上调表达。除此之外,我们还发现许多已知或未知的逆境诱导基因和抗病基因在“SunUp”上调表达,其中包括MYB、WRKY、ERF、NAC、硝酸和锌转运蛋白基因,以及其他一些参与脱落酸、水杨酸和乙烯信号通路的基因。通过可变剪切分析,我们分别在“Sunset”和“SunUp”中发现了 67 686和68 455个可变剪切事件,它们各自对应10 994和10 995个番木瓜注释基因。GO富集分析结果表明,仅在“Sunset”中发生可变剪切的基因与仅在“SunUp”中可变剪切的基因显著不同。总而言之,非转基因“Sunset”与转基因“SunUp”的转录组表达图谱大体相似,只有少数几处有显著的差异,也正是这些差异体现了转基因番木瓜的高抗病性。另外,在全基因组表达水平并没有发现在基因转化后有任何有害通路、毒性蛋白或致敏蛋白产生。我们的结果为揭示转基因番木瓜对PRSV的抗性机制打下了基础。