论文部分内容阅读
本研究基于高通量测序的两种不同策略对小黄鱼基因组进行的分析,利用WGS对小黄鱼的基因组在原有的基础上进行重新组装,并进行了重新注释,利用有良好的基因组的近缘物种,对小黄鱼基因组的基因家族进行扩张收缩分析,鉴定其中与生长相关基因家族。基于2b-RAD技术对南北群体的小黄鱼进行群体分析,进一步进行大小黄鱼的比较基因组学研究,研究具体内容如下:1.小黄鱼基因组组装质量的提升利用原有的来自于东海海域野生小黄鱼的测序数据(141x),对测序reads重新执行质量过滤后,对基因组大小进行预测预计基因组大小为687m,使用新版本的Platanus(v1.2.4)组装得到了692m的基因组,与预测结果接近。将用于组装基因组的测序片段重新比对到基因组上,总共有98.93%(91.53%)的测序数据能够比对到基因组上,基因组BUSCO达到了87.5%,对比于旧版基因组,在contig N50和scaffold N50上都有很大提升,新版基因组的contig N50和scaffold N50分别从3.6k和40k达到了7.9k和146k。对基因组进行重复序列和基因注释。小黄鱼基因组的重复序列占比为14.04%,使用同源蛋白比对预测和从头预测的方法,在小黄鱼的基因组中共注释得到了29950个基因。基于全基因组核酸序列的共线性比对结果,显示小黄鱼基因组数据于大黄鱼基因组有良好的共线性,共线性比例达到了79.48%,从另一方面展现了小黄鱼基因组的准确性。2.大小黄鱼基因组比较及生长相关基因提取小黄鱼单拷贝同源基因序列与大黄鱼数据进行了Ka/Ks的计算分析,总共367个基因显著得受到了正选择。其中中3个被注释为生长相关因子,分别为SMAD3,FGFR4,GDF6b。在基因家族分析中引入了欧洲鲈鱼与美妊丽鱼还有斑马鱼一同分析,小黄鱼独有的基因家族768个,大黄鱼与小黄鱼共享了14782个基因家族,鲈形目共享了其中的13209个基因家族,仅在黄鱼属中共享的基因家族数目为364个。扩张表达中,总共有11大类被GO注释为生长相关基因家族,分别是细胞连接,嘌呤代谢,吞噬小体,受体相互作用,GnRH信号通路,细胞间隙连接,细胞黏连,细胞外基质受体相互作用,Ca2+信号通路,ABC转运蛋白等。3.基于2b-RAD的小黄鱼不同群体SNP开发及注释从大连,旅顺各采集了5尾与6尾的野生小黄鱼样本,连同来自于舟山六横小黄鱼养殖基地的5尾养殖小黄鱼进行简化基因组测序,利用已组装及注释完成的小黄鱼基因组进行SNP开发,总共挖掘出6457个SNP位点,这些SNP能够验证群体分离。但是这些小黄鱼个体具有极高的近交系数,群体内多样性较低。经过SnpEff注释总共6123个位于编码基因上,其中有7个SNP突变会对蛋白质造成破坏性(high impact)的影响,可能会导致蛋白质截断,功能丧失或者无义介导的mRNA降解(NMD),其中有5个属于生长因子类蛋白质。以及共618个可能影响蛋白质有效性的SNP位点突变(moderate impact)。