论文部分内容阅读
油茶属于山茶科(Theaceae)山茶属(Camellia L.)植物,是我国重要的木本食用油料树种,在推进地方经济绿色增长、维护国家食用油安全和乡村振兴中具有十分重要的作用。目前,油茶主栽品种主要为多倍体的普通油茶(Camellia oleifera Abel),由于油茶基因组大且亚基因组间的同源异源构成非常复杂,使得多倍体油茶基因组的解析非常困难。狭叶油茶(Camellialanceoleosa.)是油茶组中唯一的二倍体野生种,和多倍体普通油茶亲缘关系最近,因此,破译狭叶油茶基因组对从分子层面全面了解油茶性状具有重要的意义。本研究以二倍体狭叶油茶为材料,运用二代、三代测序技术,开展了全基因组测序、组装和注释;基于此基因组数据信息,开展了狭叶油茶比较基因组分析,以及与油茶花期调控相关的MADS-box基因家族分析,旨在为油茶分子育种和花期调控提供理论依据。主要研究结果如下:1.组装注释了染色体水平的狭叶油茶基因组。利用三代Nanopore、二代Illumina和Hi-C技术,获得了狭叶油茶(2n=30)高质量染色体水平基因组。基因组大小约为3.00 Gb,N50为1.20Mb,杂合率高达2.2%,91.85%的序列被挂载到15条染色体上。BUSCO评估可以找到约95.42%的完整基因元件,CEGMA评估core gene占比达到93.55%。使用Illumina的同源预测、从头注释和转录组预测方法进行基因结构预测,狭叶油茶基因组中包含基因54,172个。非编码RNA注释预测了 807 个 rRNA、170 个小 miRNAs、472 个 snRNAs 和 920 个 tRNAs。重复序列注释表明狭叶油茶基因组重复序列占基因组的80.63%,其中转座子比例为78.53%。根据GO、KEGG等基因组功能注释,一共注释了 50,284个基因,占全部基因的92.82%。2.开展了狭叶油茶比较基因组分析。对狭叶油茶、茶树、拟南芥、猕猴桃、和杨树基因组进行比较分析,发现狭叶油茶中含有2,169个特异的基因家族,包含8,006个基因。对狭叶油茶、茶树、拟南芥、猕猴桃、杨树、葡萄和水稻的基因组进行比较分析,发现狭叶油茶基因家族中,共有705个基因家族包含5,057个基因显著扩张。对不同物种分歧时间进行计算,发现狭叶油茶和茶树在6-7百万年前发生分歧。在狭叶油茶和茶树分化之前,狭叶油茶基因组中发生了一次全基因组复制事件,这次全基因组复制事件时间大约在65百万年前。与茶树相比,狭叶油茶的基因受到的纯化选择更弱,有918个基因可能经历了正选择。在染色体水平上,茶树有7条染色体比狭叶油茶受到更强的纯化选择。3.开展了与花期调控相关的MADS-box基因家族分析。通过HMMER搜索,共鉴定到104个狭叶油茶MADS-box基因,并将其与其他物种进行比较。系统发育分析表明,狭叶油茶MADS-box基因缺少AGL12和BS两个亚族。保守基序分析表明,大多数MADS结构域外的基序只分布在特定的群体中。染色体定位及复制分析发现,片段复制可能是MADS-box基因扩增的主要原因。ClMADS基因的同源性分析表明,一些同源对可能在双子叶植物和单子叶植物分化后形成,而一些同源对可能在祖先分化之前就已经形成了。Ka/Ks分析表明,狭叶油茶MADSbox基因家族在进化过程中可能经历了较强的纯化选择压力。蛋白互作用分析表明,部分ClMADS与花发育和开花途径中发挥重要作用的蛋白质相互作用。蛋白质3D结构同源模建表明,大多数ClMADS蛋白具有相似的结构。在ClMADS基因的启动子中发现了大量与光响应、激素响应、逆境响应和发育相关的顺式作用元件。此外,表达谱分析表明,ClMADS21、CMADS 9和ClMADS 74可能与花期调控相关。