论文部分内容阅读
随着全基因组测序变得商业化,测序成本的降低,在生物多样性,种群历史动态,及适应性进化等方面的应用越来越广泛。将全基因组学与群体遗传学进行结合,对虎的群体进化,群体多样性和亚种的分化机制进行研究,不仅能加深对虎的理解,更可以为其他物种的研究提供参考。最主要的是对种群遗传多样性的恢复并最终放归大自然提供依据。虎(Panthera tigris)是最大的猫科动物。在生态系统中,虎位于食物链的顶端,具有调节生态平衡和物种多样性的作用。处于不同地理条件下的虎亚种,在身体的某些方面也发生了巨大的变化。在生理方面,比如脂肪的存储,食物的消化和身体代谢的差异;在外型方面,比如毛色,花纹,体型大小等的差异。对这些方面的形成机理进行研究,可以更加理解区域差异造成种间差异的原因,以及为了对环境更好的适应,物种所进行的进化。同时对其他虎亚种的进化机制提供参考。对于保护濒危野生动物,了解他们的生存状态及种群历史动态与环境气候变化之间的规律,对于采用针对性的保护措施具有重要作用。本文利用二代测序技术,对5只东北虎和3只华南虎进行全基因组重测序。结合SNP和CNV多态性的分析,对两个群体之间的遗传结构特征,基因交流情况和进化机制进行研究,取得的结果有:1.通过全基因组重测序,本研究共在东北虎和华南虎中得到了 647Gb的高质量clean data数据,平均测序深度为27.5 X;共获得630万个高质量的SNPs,位于非编码区的SNP有429万个(67.9%),并且编码区域内的非同义突变有18534个,同义突变有25148个;共获得173万个InDels,其中有插入86万个(49.8%),缺失87万个(50.2%),位于编码区域的InDels有2114个(0.12%);共获得27万个CNVs,其中缺失有26万个(97.5%),重复有6783个(2.5%)。平均每个个体含有32676个CNV,平均长度为4029bp。2.利用邻接法构建了两个虎亚种群体的进化树。从进化树中可以看出两个种群分化明显。利用线粒体全基因组对虎亚种之间的遗传距离和变异程度进行分析,得出亚种之间遗传距离最小的为东北虎与孟加拉虎,孟加拉虎与华南虎和苏门答腊虎的遗传距离最大,而华南虎与苏门答腊虎的遗传距离较小。通过重新构建虎和9种常见哺乳动物线粒体的系统发育树可以看出,大约100万年之前虎就与其他8个哺乳动物分离开。在100多万年以前,虎曾与人类的祖先共同生活在一起。3.对东北虎与华南虎的PCA分析发现东北虎和华南虎在全基因组水平具有显著差异;从二者的遗传结构分析结果发现,东北虎与华南虎差异显著,这与进化树和PCA分析的结果一致。利用PSMC分析8只虎的种群历史动态得出8只虎亚种具有共同的祖先,并且在距今大约70万年的时间里,种群有一个扩张,并达到了最高的种群数量(Ne=3万)。4.基于SNP的选择消除分析,在东北虎和华南虎中分别筛选出133和182个选择区域,经东北虎和华南虎的重叠区域进行合并,得到东北虎和华南虎的受选择区域分别有45和103个,二者之间共有79个相同的染色体区域。发现东北虎和华南虎中的基因具有相似的功能富集和通路分析,二者的基因主要富集在9大类生物功能中,其中参与能量代谢的基因有22个,参与肌肉收缩功能的基因共有9个,与肉食性取食相关的基因有20个。在KEGG通路分析中,东北虎和华南虎中的基因分别注释到200和192条生化通路,在这些通路分析中发现有38个基因参与到多条疾病相关通路中,这些基因可能与虎的易患疾病及寄生虫感染相关。5.基于CNV的选择消除分析,本研究一共鉴定出782个受选择的区域,这些区域的总长度为3.9Mb,平均长度约为4.9Kb,包含94个基因。去除与SNP分析相一致的结果外,发现有30个参与嗅觉功能的基因。6.对东北虎和华南虎受选择区域的基因进行分析,在东北虎的受选择区域共有702个基因,华南虎的受选择区域共有414个基因,二者共同拥有的基因有50个。发现位于东北虎中的PRKG1具有强烈正选择信号,并与冷适应相应答。TLE3基因在P101L位点上有一个错义SNP突变,从而推测该位点的突变可能是造成东北虎的体型较华南虎差异明显的原因。