论文部分内容阅读
Phenylobacterium zucineum是一种我们在人红白血病细胞株K562中发现的兼性胞内寄生菌,我们把首次发现的这一菌株命名为HLK1~T。由于该菌寄生在肿瘤细胞内,而目前大多数胞内寄生菌都是病原体,因此该菌很可能和致病性有关;由于该菌是兼性胞内寄生菌,所以在胞内和胞外的细菌生存形态不同,研究其侵入人宿主细胞的机制有着重要意义;由于本组的生物学实验研究表明,该菌的侵入方式为“拉链”方式,即通过表达一些表面蛋白,包括膜蛋白和分泌蛋白(即外排蛋白),与真核细胞表面受体相互作用,该受体-配体的结合引起宿主细胞骨架发生重排、细胞膜延伸并包裹该菌,形成吞噬泡并侵入细胞。所以寻找其表达的蛋白及受体-配体相互作用机制是研究中的一个重点。通过全基因组测序、基因注释、蛋白翻译以及搜索蛋白的N-端信号肽,跨膜α-螺旋等外排信号来预测其外排蛋白是一个很好的根本方法,它可以促进潜在生物学意义的发掘。细菌基因组的全基因组测序目前已经是相当成熟的技术了,截至2006年5月,NCBI上公布的完成全基因组测序的细菌已达343种。细菌基因组测序带来的意义和应用相当广阔,从最基本的来说它可以帮助我们鉴定相关的基因,为下一步的研究工作奠定基础。本文中所用到的是“全基因组散弹法”(Whole-genome-shotgun)对HLK1~T全基因组进行测序和分析。在注释阶段,我们采用了国际通用的Glimmer软件预测开放阅读框(ORFs),用RBSfinder对蛋白的起始密码进行校正后用BLAST对ORFs进行NCBI的非冗余数据库的同源性检索,以预测每个编码序列(CDS)的功能。并且对P.zucineum基因组编码的所有蛋白进行COG分类。对注释得到的基因应用Translate工具软件进行翻译获得其氨基酸序列为下一步预测外排蛋白做准备,最后应用SingalP v3.0,LipoP v1.0,Phobius和TMHMM 2.0对HLK1~T基因组所编码的外排蛋白进行综合预测。对Ⅳ型蛋白和Tat通路蛋白这种具有保守序列的外排蛋白采用手工方法进行搜索。最后结果显示,P.zucineum基因组大小为4,379,231bp,由一个大小为3,996,255bp的环状染色体和一个大小为382,976bp的质粒组成。染色体和质粒的GC含量分别为71.4%和68.5%。我们在染色体上鉴定到42个tRNA基因和1个16S-23S-5S rRNA操纵子。HLK1~T基因组的一个显著特征是高GC含量,位于已全基因组测序的343种细菌基因组中的第四位。而另外几种高GC的细菌大多属于放线菌纲。由于放线菌同时具有细菌和真菌的特征,从生物进化的角度看,它还是属于介于细菌与真菌之间的过渡类型。P.zucineum基因组的高GC含量不仅预示着复杂的二级结构,而且可以进一步探求该菌与放线菌之间在高GC含量上的潜在关系。在已全基因组测序的细菌基因组中,与P.zucineum同源性最高的是新月柄杆菌(C.crescentus)。C.crescentus是一种用于研究细胞分化、不对称分裂、细胞周期调控的单细胞模式生物,单个菌细胞可分裂成两个不同类型的细胞,与病原体有许多共同的基因。其中的ctrA基因是C.crescentus中控制细胞周期的主调控基因,具有细菌生存必须的并具有转录的自我调控能力,编码一种二元信号转导系统(Two-component signal-transduction system)关键应答调控子。二元信号转导系统能够感应外界环境的变化,继而把信息传递给内部系统,在病原菌对宿主的识别和侵袭、进一步的致病或共生等过程中起着非常重要的作用。我们在P.zucineum中找到了ctrA与同源性高达93%的序列,命名为ctrZ,对于进一步探讨P.zucineum可能的致病作用具有重要的意义。根据注释的结果我们发现,P.zucineum共编码3681条蛋白(染色体3534条,质粒327条)。在这其中,3,715个可以和非冗余蛋白库比对上。而在能够比对上的这些蛋白中,866个是保守的假定蛋白,2,849个蛋白有已知或者预测的功能。大量功能未知的序列提示着新功能和新基因存在的可能。P.zucineum的基因组中含有丰富的二元信号系统,转录调控子,和热休克反应蛋白,使得菌株能够在转录和翻译后水平对外界的刺激做出相应的反应。在这102个二元信号转导系统蛋白中(11个编码基因位于质粒上),有36个组氨酸激酶,48个反应调控子,18个和组氨酸激酶、反应调控子融合的杂交蛋白。16对组氨酸激酶和反应调控子紧密连锁并可能形成功能性操纵子。这些紧密连锁的元件使得二元信号系统对外界环境的变化能够有效地做出反应。HLK1~T的基因组中包含18个ESFσ-因子(4个位于质粒上),它们能够协调胞外刺激和细菌的基因表达。我们还找到了170个转录调控子(154个有染色体编码,16个由质粒编码)(表3),这使得HLK1~T拥有对任何已知的环境刺激做出有效应答的潜能,包括青霉素抗性,低温抗性,以及金属抗性。HLK1~T基因组有3个热休克σ-因子基因rpoH(2个位于染色体上)和35个热休克分子伴侣基因(15个位于染色体上,20个位于质粒上)。根据文献报道rpoH可以协助E.coli对抗温度的剧烈变化,而热休克分子伴侣可以在多种环境压力的诱导下产生,包括细胞能量消耗,极高浓度的重金属,和各种有毒物质。通过对蛋白的注释我们也发现在HLK1~T基因组编码的蛋白中有Sec依赖的、Sec-非依赖的、Ⅱ型以及Ⅳ型外排系统的组成成分。注释找到了蛋白转运的Sec依赖的通路的组成蛋白的编码基因例如SecA(PHZ_c0758),secB(PHZ_c0006),secD(PHZ_c1954),secE(PHZ_c1211),SecF(PHZ_c1953),secG(PHZ_c1752),和secY(PHZ_c1250)。也有蛋白外排所需要的信号肽酶(PHZ_c1871),脂蛋白信号肽酶(PHZ_c3162)和信号识别小体srp54(PHZ_c0117)和受体(ftsY,PHZ_c0131)。Tat通路是用来转运已经折叠的蛋白通过质膜的Sec非依赖的外排通路,在5个己知的Tat蛋白中,TatABC存在于P.zucineum中。而13个编码Ⅱ型分泌系统的蛋白互相连锁形成一个操纵子。与此同时,P.zucineum中还存在3套Ⅳ型分泌系统,其中1套由质粒编码。因此无论是利用哪种通路进行外排的蛋白都能顺利实现其从胞内向胞外的转运。HLK1~T基因组中还含有对抗氧化压力的各种成分。包括超氧化物歧化酶,过氧化氢还原酶等。此外,还含有组成对抗胞内氧化压力的GSH-氧化还原循环的各种组成成分。为了适应胞内的生存环境,P.zucineum还编码能够利用宿主的离子资源为自己所用的蛋白,1个ABC型的铁载体转运体系,60个能够摄取离子复合物的TonB-依赖的受体(2个由质粒编码)。预测分析得到基因组编码的蛋白中有35.4%为外排蛋白,其中以跨膜蛋白为最多,共预测到735个,占总蛋白的19.0%,外排蛋白的53.3%。此外,它还编码Ⅰ型分泌蛋白(499个,占总蛋白的12.9%,外排蛋白的36.2%)和脂蛋白(101个,占总蛋白的2.6%,外排蛋白的7.3%),以及4个Ⅳ型蛋白和12个Tat通路蛋白。直系同源簇方法,即从同一簇中的已知基因注释未知基因的功能的这种COG(Cluster of orthologous group)中,目前已有25种,P.zucineum基因组含有其中的20种,并以未知功能的COG居多。鉴于外排蛋白的预测结果以及P.zucineum的兼性胞内寄生菌的特征和“拉链”式侵入细胞的特性,在这20类COG中尤以与细胞壁/膜/荚膜合成相关、无机离子转运和代谢有关的、氨基酸转运和代谢有关的、脂质转运和代谢有关的、信号传导机制相关、胞内传输/分泌/小跑传输相关的蛋白这几类最有意义。HLK1~T编码的蛋白中有大量外排蛋白,这些蛋白可能在细菌与宿主的相互作用以及胞内寄生的过程中发挥重要作用。