论文部分内容阅读
黄脸油葫芦Teleogryllus emma (Ohmachiet Matsumura1951)隶属于直翅目(Orthoptera)蟋蟀总科(Grylloidea)蟋蟀科(Gryllidea),分布范围极为广泛,是重要的资源昆虫之一,可用于医疗、饲料和食品领域,具有一定的经济价值。由于该物种具有个体大、易解剖等特点而广泛应用于科学研究。目前对于黄脸油葫芦的研究主要集中在生理功能、胚胎发育、内分泌和毒理学等方面,在分子生物学方面的研究不多。叶伟等已于2008年测定并分析了线粒体基因组全序列,但转录组学及线粒体转录作图方面的研究目前未见报道。本文以黄脸油葫芦为研究对象,从转录组线粒体基因组以及线粒体转录组作图三个方面进行了分子生物学方面的研究与探索。本研究获得的主要结论如下:(1)黄脸油葫芦线粒体基因组全长15,697bp,共编码37个基因(包括13个蛋白编码基因、两个rRNA基因和22个tRNA基因)和一个长度为954bp的控制区。碱基组成具有很强的AT含量偏向性;13个蛋白编码基因除CO I以TTA为起始密码子外其余均使用标准的ATN作为起始密码子,终止密码子均为典型的TAN;蛋白质使用的密码子多为NNU和NNA;氨基酸使用情况中Leu含量最多为14.69%;除tRNASer(AGN)外的所有tRNA都能形成典型的三叶草结构。注释后的结果与叶伟的研究T. emma在基因组成、AT含量、蛋白编码基因、tRNA二级结构等方面大体一致。(2)本研究中黄脸油葫芦的线粒体基因组排列顺序与叶伟测得的一致,即存在tRNA重排现象:tRNAGlu、tRNASer(AGN)和t]RNAsn发生了倒置,从而产生了一种不同于直翅目中的蝗亚目和绝大部分螽亚目的ARNSEF的排列方式。除此以外tRNAGlu、tRNASer(AGN)、tRNAAsn由N链编码,而直翅目中其他物种则由J链编码。这些特征有可能成为蟋蟀总科线粒体基因组的共同特点。(3)黄脸油葫芦的控制区长度为954bp,存在重复单元,在15,300bp-15,355bp的范围内有22bp的碱基重复了2.5次,这种现象在非洲飞蝗(Locusta migratoria migratorioides)和亚洲飞蝗(Locusta migratoria migratoria)中均有报道。与沙漠蝗(Schistocerca gregaria)控制区序列进行比较确定了其控制区中的保守结构。比对结果显示黄脸油葫芦的控制区有4个保守序列,这些保守序列与沙漠蝗的保守序列一致性并不是很高。在控制区中发现了茎环结构,茎由15个碱基对组成,环由18个碱基组成。(4)通过对黄脸油葫芦的雌性成虫和雄性成虫转录组测序分别获得clean reads52,507,034条、51,524,978条。拼接和组装后雌虫样品得到了64,806条Unigene,雄虫样品得到了63,760条Unigene,二者合并获得了物种Unigene62,854条即All-Unigene。(5)将All-Unigene与Nr、SwissProt、KEGG和COG数据库比对,有30,180个All-Unigene得到了注释,占All-Unigene总数的48.02%。有26,386条比对到Nr数据库中,注释信息最多;10,576条比对到COG数据库中;19,776条All-Unigene参与了KEGG的pathway代谢通路;注释到GO功能数据库中的All-Unigene有13,560条。(6)对All-Unigene的SSR进行分析,共找到4,803个SSR位点,这些SSR长度分布在11-24bp之间,其中单核苷酸SSR为835个,二核苷酸1,301个,三核苷酸2,258个,四核苷酸131个,五核苷酸165个,六核苷酸113个。重复单元的类别共有146种,其中出现频率较高的四个重复单元类型分别为CCG/CGG、 A/T、AC/GT、AG/CT。(7)对All-Unigene的SNP检测,雌虫中共发现了43,047个变异位点,碱基转换有26,824个;颠换(transversion)有16,223个。而在雄虫中共发现40,761个变异位点,碱基转换有25,282个,颠换(transversion)有15,479个。可得出黄脸油葫芦的雌雄成虫的变异位点的数目及类型分布大体一致,碱基转换位点(>60%)的数目均大于颠换位点的数目,颠换变异位点中A-T所占的比例最高,雌雄成虫分别达到11.36%和11.23%。(8)从雌雄成虫中筛选了16,326个差异基因,其中雌虫体内转录上调的基因有9,698个,雄虫体内转录上调的基因有6,528个。差异基因的GO功能分类显示有4,319个差异基因得到注释:注释到生物学过程的有18,823个,注释到分子学功能的有9,382个,注释到细胞组分的有5,635个。在分子功能中,归到结合功能的差异基因最多。差异基因的KEGG代谢通路注释结果表明共有6,455条注释到了256个不同的代谢通路中,有46条差异基因的代谢通路显著富集,其中参与代谢通路中的差异基因最多有909个。雌性成虫中发生上调的两个基因CYP314A1和CYP18A1均属于CYP450酶系,推测其可能参与性激素的生物合成。雄虫成虫中JHAMT、EO、Nvd上调,推测其与保幼激素、蜕皮激素以及胆固醇的合成有关。(9)线粒体转录物作图表明:在15,697个位点中有15,305个位点有reads覆盖,覆盖率高达97.5%,没有覆盖的位点的序列为tRNAIlE、tRNAGln以及tRNAMet和控制区的部分序列。核糖体RNA的转录效率大于蛋白编码基因,这充分说明rRNA在核糖体的组装过程中起到重要作用。16S rRNA覆盖度呈显著差异可能与其特殊的二级结构有关。ATP6和ATP8、ND4和ND4L两对蛋白编码基因存在碱基重叠现象,是由一条双顺反子共同转录而来的。本研究对黄脸油葫芦的线粒体基因组进行测序并分析验证了蟋蟀总科线粒体基因组中tRNA重排现象的存在;对雌性成虫、雄性成虫两个样本进行了转录组深度测序并注释,获得了大量有关基因功能方面的注释信息;在筛选出差异表达基因的基础上进行了功能分析,获得了与黄脸油葫芦的生长发育和性别调控的数据信息;对线粒体转录组的作图研究,完善了线粒体基因组注释的不足。