基于蜜蜂球囊菌纳米孔测序数据的基因非翻译区延长、SSR位点发掘及未注释基因和转录本鉴定

来源 :昆虫学报 | 被引量 : 0次 | 上传用户:w7kny6194i
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
[目的]利用已获得的纳米孔长读段测序数据完善现有的蜜蜂球囊菌Ascosphaera apis参考基因组注释信息,并对未注释的新基因和新转录本进行鉴定和功能注释.[方法]基于已获得的纳米孔长读段测序数据,采用gffcompare软件将蜜蜂球囊菌全长转录本与参考基因组注释的转录本进行比较,进而对参考基因组注释基因的非翻译区(untranslated region,UTR)进行延长.利用TransDecoder软件对蜜蜂球囊菌基因的开放阅读框(open reading frame,ORF)及相应的氨基酸序列进行预测.通过MISA软件发掘长度在500 bp以上的全长转录本的SSR位点.通过Blast工具将鉴定到的新基因和新转录本比对Nr,KOG,eggNOG,Swiss-Prot,Pfam,GO和KEGG数据库进行功能注释.[结果]共对蜜蜂球囊菌的9 481个基因进行了UTR延长,其中5'UTR和3'UTR延长的基因分别有4 744和4 737个.共预测出10 492个完整ORF,其中编码长度分布在0~100和100~200个氨基酸的ORF最多,分别占ORF总数的38.96%和36.90%.共鉴定到5 286个SSR,其中单核苷酸重复、二核苷酸重复、三核苷酸重复、四核苷酸重复、五核苷酸重复和六核苷酸重复的SSR分别为1 870,826,2 398,138,43和11个.共鉴定到1 558个新基因,其中有1 556,731,330,592,1 177,709和589个新基因可分别被注释到Nr,Swiss-Prot,Pfam,KOG,eggNOG,GO和KEGG数据库.此外,还鉴定到14 403条新转录本,其中有14 376,8 524,7 276,7 405,12 035,7 891和6 855条新转录本可分别被注释到上述7个数据库.[结论]本研究利用已获得的纳米孔长读段测序数据对蜜蜂球囊菌的完整ORF进行了预测,对参考基因组的已注释基因进行了UTR延长,对未注释的SSR位点进行了发掘,此外还鉴定到大量未注释的新基因和新转录本,并对它们进行了功能注释.研究结果较好地完善了现有的蜜蜂球囊菌的基因组注释,为其组学和分子生物学研究的深入开展提供了基础.
其他文献
1、Nokia价格实惠,长相一般,是老婆的不二人选;iPhone长得漂亮,要搞定得用银子。  2、Nokia用着很放心,就像老婆一样死心塌地;iPhone用着总怕偷,就像情人还有好多眼睛也盯着。  3、Nokia很普通,就像老婆很大众化;iPhone很潮很时髦,能够满足你的虚荣心。  4、Nokia比较耐摔,就像老婆时常闹些别扭但总归会和好的;iPhone往往不会给你摔第二次的机会。  5、Nok
施工项目是建筑施工企业对一个建筑产品的施工过程和成果,也就是建筑施工企业的生产对象,可能是一个建设项目的施工,也可能是其中的一个单项工程或单位工程的施工。其主要特征:一
【摘 要】本文主要通过对工程项目施工中索赔工作的阐述,从实践角度对如何加强索赔,从起因、依据、程序、技巧等方面进行了探讨和研究。  【关键词】工程项目;索赔;思考  工程建设项目承包是一项复杂的系统工程,其过程可变因素多、实施周期长、客观环境复杂,尤其是当前市场普遍采取无标的招标、复合标的招标等条件下,选择合理低价是大多数承包商的投标策略,但是在维护正常企业利润,就必须重视在法律和合同条款下的工