论文部分内容阅读
目的:
1、建立一个整合子的分析平台,为研究其遗传多样性提供方便;
2、为分析和注释实验获得的整合子数据提供一个比较快捷的通道;
3、比较完全地分析了整合酶附近基因盒内包含的基因的种类和功能;
4、对目前的整合子序列进行整体分布分析,包括年代和国家等。
方法:
1、通过NCBI的RPS-BLAST序列相似性查询工具找出包含整合酶保守域的序列;
2、通过NCBI的API工具eUtils下载被注释为整合子的序列;
3、以Linux为操作平台,采用Apache+PHP+Mysql构建整合子分析平台;
4、对基因盒可能表达的蛋白质分别用PFAM和SUPERFAMILY库从域的水平上进行分析,并采用COG进行了功能水平的分析;
5、采用Perl和BioPerl对收集的数据进行辅助分析和处理。
结果:
1、从收集的整合子来看,大部分基因盒包含的基因和目前已知的基因序列相似性比较低,属于功能未知的基因,如COG的注释结果可以看出,8593个蛋白里有4263个蛋白不能找到相关的信息;
2、各型别的整合酶数量差异非常大,大部分是intI1,而且有很多intI1没有被命名;
3、建立了一个整合子分析平台,将整合子结构以图片的形式公布,更加直观。用户可以对不同来源的整合子进行比较,查看基因盒内基因的详细注释;
4、除了高通量测序得到的uncultured bacterium数据,整合子主要来源于医院内较常见的Pseudomonas,Escherichia,Salmonella和vibrio四个属的菌株,其中又以Escherichia coli和Pseudomonas aeruginosa最多;
5、整合予结构复杂,很多是通过物种来命名,相对比较杂乱,尚需一种新的分类方法来解决。
结论:
1、1类整合子相对其他数量比较多,intI1已经是基因盒传递的一个比较适合的媒介;Ⅱ类整合子酶活性低,这与目前临床上发现含Ⅱ类整合子的菌株比较少一致;
2、各型别之间整合酶序列差异不显著,尤其序列的保守结构域,但其作用的位点差异比较明显,甚至是7bp的结构也有些不符合规则;
3、分析平台的建立,可以为今后研究整合子的结构和演变提供更方便的有用信息;
4、高通量测序技术的发展,使整合子的数据来源越来越丰富,对院外整合子的分析可以促进这一可移动遗传元件的研究。