论文部分内容阅读
为探索直翅目昆虫个体生长发育和性别分化分子调控机制及了解直翅目昆虫线粒体转录组基因表达特征,使用Illumina HiSeq4000测序平台对短角外斑腿蝗(Xenocatantops brachycerus)的雌性成虫(FA)、雄性成虫(MA)和雄性若虫(MN)三个样本的转录组进行了测序,得到Clean Reads使用Trinity进行从头组装,得到短角外斑腿蝗的Unigene后进行功能注释。对三个样本之间的差异表达基因(DEGs)筛选并进行GO和KEGG功能鉴定和代谢通路注释。同时,用qRT-PCR对14个DEGs进行表达水平的实验以验证转录组数据的可靠性。最后,以短角外斑腿蝗线粒体全基因组序列为参考进行了测序reads和Unigene覆盖作图来分析线粒体基因的表达情况。获得的主要结论:(1)从三个样本FA、MA和 MN 中总共获得了 13.32Gb(FA 4.46Gb,MA 4.43Gb和MN 4.43Gb)的测序数据,进行无参考基因组从头组装后,FA获得40,522条总长度为 39,255,884bp 的 Unigene,MA 共获得 20,187 条总长度为 14,320.681bp 的Unigene,MN获得24,030条总长度为16,998,200bp的Unigene。使用三个样本合并组装的策略,最后共获得43,187条总长度为41,642,132bp的All-Unigene,这些Unigene的平均长度为964bp,N50达到1,799bp。(2)组装得到的43,187个All-Unigene进行功能注释后,有24,717(57.23%)个获得注释。注释到NR数据库中的Unigene最多,有21,978个占到50.89%,注释到NT库有12,071个(27.95%),注释到COG库有9,127个(21.13%),注释到Interpro库有15,099个(34.96%),注释到KEGG库有15,762个(36.50%),注释到Swissprot库有17,692个(40.97%),注释到GO库的Unigene最少有3,272个(7.58%)。这些获得的数据为短角外斑腿蝗的生长发育、性别决定机制以及系统发育分析的分子标记挖掘研究提供了丰富的数据资源。有42.77%的Unigene没有注释到任意一个数据库中,这可能是由于数据库中缺少直翅目昆虫基因组数据。(3)DEGs筛选分析表明在FA-vs-MA之间共有15,351个DEGs;在FA-vs-MN之间共有 16,362 个 DEGs;在 MA-vs-MN 之间共有 5,932 个 DEGs。在FA-vs-MA之间的15,351个DEGs,有1,329个在MA中表达上调,有14,022个在FA中表达上调。在FA-vs-MN之间的16,362个DEGs,有1,375个在MN中表达上调,有14,987在FA中表达上调。在MA-vs-MN之间比较发现有2,545个在MN中表达上调,有3,387个在MA中表达上调。DEGs的GO分类结果表明显著富集条目均属于细胞组分这个分类,成虫在胞外复合体、胞浆成分和ATP酶复合体等条目中高表达基因数目多于若虫。KEGG Pathway注释中,剪接体、DNA复制、N-聚糖合成、碱基切除修复和脂肪酸代谢等通路在不同样本比较之间均为显著富集的通路。考虑到短角外斑腿蝗是以成虫过冬,需要积累更多的脂肪来充当食物使它渡过冬天,所以在脂类合成中需要更多的基因表达来满足这一生理机能。(4)用qRT-PCR进行了 14个DEGs表达水平的实验验证,实验结果与RNA-Seq结果基本一致,证明了转录组数据的可靠性。用来验证的14个DEGs均与短角外斑腿蝗的性别决定有很大的关系。(5)用短角外斑腿蝗三个样本Clean Reads和Unigene对线粒体基因组覆盖作图,结果表明95%的碱基位点获得测序覆盖。短角外斑腿蝗转录后产生5个转录本,分别为Jl、J2、N1、N2和N3。三样本在线粒体表达量趋势上基本一致,L-rRNA、COX1、COX2和COX3基因是覆盖度最高的基因,而ND6、ND4L和S-rRNA基因是覆盖度最低的基因。L-rRNA覆盖度最高可能是存在独立而高效的转录起点,S-rRNA覆盖度最低可能是由较短的poly(A)尾导致的低效测序造成的。本研究是首次对短角外斑腿蝗进行转录组测序研究,三个样本互相比对分析获得的大量的差异表达基因,将为深入开展蝗虫的转录调控机制的探索提供基因层面的信息;找到的一些涉及到短角外斑腿蝗生长发育与性别调控机制相关的关键基因,识别到的大量的SNP为此研究提供了有价值的帮助。同时,获得的转录组数据将对基于谱系基因组学方法的直翅目生命之树的构建提供数据支持。