论文部分内容阅读
沙棘属(Hippophae),属于胡颓子科(Elaeagnaceae),包括7个种和11个亚种,主要分布在欧亚大陆温带地区。自从被发现以来,沙棘属植物的分类和各类群系统发育关系都存在争议。叶绿体基因组具有长度小,核苷酸替换率低,单亲遗传,基因含量和基因组结构顺序保守等特点,被认为是研究系统发育问题的有力工具。本研究利用二代测序技术,从头测序和组装了沙棘属5个种和8个亚种和胡颓子属沙枣共37个体叶绿体基因组全序列,并对代表性个体进行了注释;对沙棘属叶绿体全基因组进行了深入的适应性进化分析;基于叶绿体基因组变异分析了沙棘属系统发育关系。主要研究结果如下:1)沙棘属植物叶绿体基因组大小在154 983-156 514 bp之间,均为典型的四分体结构:由长单拷贝(large single copy,LSC)区和短单拷贝(small single copy,SSC)区,以及一对分隔开它们的反向重复序列(inverted repeats,IRs)组成。沙棘属内各种叶绿体基因组GC含量变化不大,约为36.6%-36.7%;属内各种和亚种的叶绿体基因组均包含130个基因,包括84个蛋白质编码基因,38个t RNA基因和8个r RNA基因。沙棘属与胡颓子属代表性物种的叶绿体基因组有着完全一致的叶绿体基因构成;但和胡颓子属相比,沙棘属叶绿体基因组大小有所扩张,该扩张体现在LSC、SSC与IR各区。2)沙棘属叶绿体基因组序列显示出适度的序列分化,一些分化较快的区域主要分布在LSC区和SSC的基因间隔区;属内各物种和亚种间叶绿体基因组的基因排列顺序保守。沙棘属叶绿体基因组RNA编辑发生在密码子的第一位和第二位,以后者居多;沙棘属大多数RNA编辑位点发生编辑使原本的亲水性的氨基酸转变成为疏水性氨基酸,进而使编辑后形成的蛋白质的疏水性增高。分支模型检测出ycf1基因在西藏沙棘分支中存在正选择作用;位点策略模型检测到该属叶绿体基因组中有23个编码基因存正选择位点,其中,ycf1基因检测到的受正选择位点个数最多。3)基于叶绿体基因组全序列(除一份IR区)及叶绿体基因组编码区全序列,分别采用ML和BI方法构建的系统发育树显示,胡颓子属和沙棘属组成了两个具有高支持率的单系姐妹类群。沙棘属是由两个具有高支持率的进化支组成的:其中一支包括柳叶沙棘、肋果沙棘和江孜沙棘,另一支包括西藏沙棘和所有的鼠李沙棘的亚种。两套数据集在第二支的拓扑结构上基本一致:西藏沙棘位于该支基部;然后云南沙棘位于鼠李沙棘最基部的位置,溪生沙棘和海滨沙棘先聚在一起,它们再与高加索沙棘聚为一支,这三个亚种与中亚沙棘再聚为一支形成一个小的进化枝;蒙古沙棘和中国沙棘聚在一起形成另一个小的进化枝。然而,两套数据集在解析柳叶沙棘、肋果沙棘和江孜沙棘的拓扑关系时产生了分歧,且分支支持率有所降低。该结果与前期采用分子和形态研究存在的争议类似,说明这三个物种的分化先后顺序不明确。沙棘属约在3.30个百万年前的第三纪上新世赞克尔期开始分化,而青藏高原的第三次大规模隆升发生在上新世后期至第四纪初,所以沙棘属的开始可能和青藏高原第三次大规模隆升相关,也支持沙棘属其起源于青藏高原和邻近的高原,然后才迁移到其他北半球区域并经历了发散的假说。以上结果说明,沙棘属植物叶绿体基因组大小有限扩张,但结构和基因类型稳定;少数基因可能在某些类群中受到正选择作用,RNA编辑则在一定程度上维持了叶绿体蛋白质编码基因的正常功能,但这些仍需后期进一步的分子生物学功能验证;沙棘属起源于青藏高原地区,且可能和青藏高原的隆起有关。这些结果是沙棘属分类的重要依据,也是后期针对该属植物的叶绿体基因组开展更深入的分子工程研究的基础,更是深入探讨沙棘属植物进化过程的前提。