论文部分内容阅读
小麦族(Triticeae)是禾本科植物中重要的一个族,具有丰富的遗传变异类型,是农牧业上良种繁育、牧草利用的重要基因资源库。该族相对年轻,大约在2500万年前从其他禾本科物种中分化出来。但由于多倍体化、属间杂交、基因渗入使该族系统分类混乱,不同学者间存在较大分歧,这是为实现更好地利用小麦族丰富的基因资源,在整个小麦族内拓展小麦可利用的基因池的目标急需解决的问题。本研究综合应用生物信息学、比较转录组学和系统发生分析,在全基因组和转录组水平,系统研究小麦族的进化关系和普通小麦不同亚基因组之间的选择压。主要结果如下:1.20个小麦族物种转录组测序及组装。对小麦族的20个物种(分属9个属,包括19种基因组类型,其中6个为异源多倍体)进行二代转录组测序或全长转录组测序。根据测序数据类型及有无参考基因组信息,分别采用无参组装、有参指导下的无参组装、有参组装,以及全长转录组质控分析的方法,得到20个物种高质量的转录本,为小麦族系统进化研究、遗传学研究及小麦分子育种提供了基础数据。2.评估转录本完整度。将每个物种的转录本与有胚植物中1440个单拷贝直系同源基因比对,评估转录本的完整度,并据此确定不同策略下合适的测序数据量。二代转录组测序数据量为10-20 Gb,其中二倍体物种的缺失率小于11.3%;全长转录组在PacBio Sequel测序平台的测序数据量约为8 Gb,直系同源基因的缺失率为(15.8%-30.8%),因此对于基因组较大的小麦族物种,全长转录组的测序量应该至少为16G;有参组装的野生二粒小麦(基因组AABB)的缺失率为1.9%,并且获得了83.8%的加倍了的基因,说明在异源多倍体物种转录组组装中,有参组装的巨大优势。3.全基因组和全转录组水平的小麦族系统发生分析。利用all-to-all blastn和系统发生树相结合的方法,在小麦族20个物种(将普通小麦不同亚基因组看做不同物种)的转录组和大麦基因组中,以及作为外群的水稻和二穗短柄草基因组中,共鉴定出20,557个同源序列群,在其中鉴定出1,348个直系同源群。将1,348个直系同源群按顺序连接起来,进行比对建树,最终获得所选小麦族物种的物种树。其拓扑结构显示:小麦族物种构成一个单源分支,除簇棱轴草之外,又分为两个亚分支:小麦亚族分支和大麦亚族分支。簇毛麦、毛穗旱麦草、旱麦草、普通黑麦位于小麦亚族分支的基部。较高等小麦亚族物种分为A、B、D 3个单源分支。3个分支中不仅含有小麦属和山羊草属的物种,还含有其他属的物种,因此本研究结果不支持小麦属和山羊草属是单一起源的结论。4.单拷贝基因赤霉素受体GID1在小麦族中的鉴定及生物信息分析。在21个小麦族物种转录组和基因组中共鉴定到27条赤霉素受体GID1的直系同源序列,它们分为两种类型,其中A型与拟南芥和水稻中的GID1类似,而B型的氨基端较A型多出300 bp左右,且对应的蛋白序列保守。通过对A和B两种类型的GID1蛋白三维结构预测分析,发现B型的氨基端有更多的α螺旋。不同于拟南芥一个基因组有3个拷贝,小麦族的一个基因组(亚基因组)只有一个拷贝。在小麦族较早分化出来的物种中只含有A型GID1,而在较晚分化出来的物种中则含有A和B两种类型的GID1,这说明B型GID1是在小麦族进化过程中通过某种机制(如插入、重组等)造成一部分序列的氨基端长度增加而形成的。5.普通小麦(六倍体)不同亚基因组之间进化压力比较。在普通小麦的3个亚基因组中鉴定到801个同时含有来自二穗短柄草和ABD三个亚基因组至少一个的直系同源群。分别计算普通小麦每个亚基因组的编码序列与二穗短柄草编码序列之间的Ka值、Ks值和Ka/Ks值。结果显示3个亚基因组所受选择压力趋势基本一致,说明它们在生物功能上有同等重要的作用。三个亚基因组Ka/Ks值位于0.6-1区间的序列均不足10%,说明大部分直系同源序列都处于选择性进化状态,而处于中性或近中性的编码序列较少。检测到4个同源群所受选择趋势不一致,这可能与染色质重排有关。