论文部分内容阅读
菜粉蝶(Pieris rapae),鳞翅目:粉蝶科,农业上是重要的害虫之一,主要危害十字花科蔬菜。在基础研究中,菜粉蝶及其重要天敌蝶蛹金小蜂是自体免疫的重要的相互作用模型,然而其基因组尚未测序。转录组测序亦可为菜粉蝶基因表达、生物学以及防治策略提供全局性的视角。故本论文以菜粉蝶不同发育阶段的基因转录与表达为研究目标,对菜粉蝶不同生长发育阶段构建了六个mRNA库和六个small RNA库,应用illumina测序,通过基因注释与发育转录表达分析,以期获得菜粉蝶发育转录组并挖掘出与发育有关的基因。对于mRNA序列,主要内容包括转录组拼接、转录组注释与发育相关基因的筛选。首先通过de novo拼接方法,生成了96,069条unigenes序列和196,202条transcripts序列,其N50和转录本拼接序列的平均长度达到2269bp和1206bp。其中31,774(33%)条unigenes序列能显著性比对到NCBI中非冗余蛋白数据库,筛选出16500条具有完整的ORF的基因序列。统计结果显示同源性序列最多的前五大物种均属鳞翅目,表明拼接结果可靠。随后,将注释所得基因再次利用GO、COG/KOG、KEGG数据库进行深入注释,发现849个基因参与到七条主要的发育通路,如Hippo、Notch与JAK2等发育关键基因。在基因表达水平分析中,两两比较菜粉蝶相邻六个发育阶段,发现从卵期到初孵幼虫期的转变基因表达水平显著变化的基因最多;发现表皮蛋白基因的表达水平在菜粉蝶不同的发育阶段变化尤其频繁,共有20余个表皮蛋白基因在任意的相邻阶段表达水平差异显著,推测与菜粉蝶发育过程中的蜕皮调控机制有关;此外,在不同发育阶段均鉴定到阶段特异性表达的基因,这些基因可作为发育阶段的分子标签;最后,通过对热激蛋白同源进化与表达共分析,显示同源相近的hsp基因具有相同或相近的表达模式。针对smrna序列,主要研究内容包括小rna的比对注释,保守与新mirna成熟体的鉴定,mirna前体序列的预测,与表达水平研究。筛选与质控获得53,508,931条序列长度在18-24nt高质量reads,去冗余后为121,695条特异序列,78,316条特异序列分别注释到非编码rna数据库(ncbi和rfam)的rrna,trna,snrna,snorna,sirna,mirna等序列。其中以rrna占比最高,其次为trna和mirna。初选为mirna的序列再次比对到mirbase数据库,并去除冗余后,鉴定到143条保守mirna序列,其中54个mirna具有前体序列。另外,鉴定到21条新的成熟mirna,其中18条含mirna前体序列,3条pre-mirna序列包含mirna*。差异表达分析的结果显示有78条成熟mirna序列的表达水平在至少两两相邻发育阶段之间存在显著性差异,且大部分出现在从卵期到初孵幼虫期。对于mirna调控基因表达研究,主要内容包括靶基因预测、筛选参与发育代谢通路的靶基因与表达相关性分析。以拼接转录本为参考序列,应用rnahybrid和miranda软件分别预测出6,198和6,959个潜在miRNA靶位点,涉及5,589个靶基因,这些靶基因均注释到NR数据库。此外,根据KEGG数据库中与昆虫发育相关的代谢通路以及差异表达的mi RNA和靶基因表达量的高度负相关性(相关系数小于-0.8)推断出可能与菜粉蝶的生长发育相关的20条miRNA序列与37个靶基因。本论文通过RNA-seq技术首次获得了对菜粉蝶发育转录组,这是鳞翅目昆虫第一个非模式生物的发育转录组,获得了具有完整编码框的基因16500个,发现从卵期到初孵幼虫期过程中基因与miRNA表达变化剧烈,同时发现20余个表皮蛋白基因表达水平与发育紧密相关,揭示出同源性更高的热激蛋白具有相近表达水平模式,获得143条保守性miRNA,新发现21个miRNA,这些工作为后续菜粉蝶的发育生物学与基因转录调控相关研究奠定了基础。