论文部分内容阅读
2002年末在全球范围爆发了新发传染病非典型性肺炎(Severe Acute RespiratorySyndrome,SARS)疫情,这场来势汹涌的传染病检验了各国公共卫生的应急能力,同时也启发了对新型病毒研究探索的新思路。在2003年4月16日,世界卫生组织正式宣布导致SARS爆发的病原体是一种新型的冠状病毒。在爆发后的这十年时间里,国内外许多专家对其病毒的起源与进化开始了广泛而深入的研究。截至目前,荟萃既往研究结果证实SARS冠状病毒(SARS CoV)是冠状病毒中的一个独立分支,但对于SARS CoV的真实起源,虽有诸种推测,各国众多研究者却始终无法做出合理解释,更无结论。目的本研究选用生物信息学方法,计算SARS CoV的中性突变速率;应用邻接法(Neighbor-joining,NJ)构建SARS CoV的系统发育树,比较两次流行中SARS CoV的遗传距离及系统进化关系;通过计算SARS CoV的最近共同祖先(Most RecentCommon Ancestor,MRCA)日期及构建有根系统发育树,进一步探寻SARS CoV的起源和进化模式,并提出新的研究和思考方向。这为今后明确SARS CoV的宿主和应对其他重大传染性疾病提供科学的依据和研究思路。方法1.构建SARS CoV数据集:在NCBI获9条SARS CoV全基因组序列,其来自中国内陆和香港,其中,5条的宿主是人,4条的宿主是果子狸,以2003年2月11日采集的GZ02为外群,构建数据集A。在NCBI中下载2004年初以前上传的22条株全基因组序列,这22条序列别来自广州、深圳、香港、新加坡、台湾地区,同样以GZ02为外群,构建数据集B。2.在ClustalX1.81中,分别将数据集A、B的序列进行比对;在MEGA4.1中,对结果采用Pamilo-Bianchi-Li计算各病毒Ks值,在EXCEL(2010)中以Ks值与采集日期创建散点图,并进行直线拟合,获中性突变速率以及R~2。3.在软件MEGA4.1中,分别对A、B数据集应用NJ发育树。4.根据有关公式,计算两组SARS CoV的最近共同祖先日期(TMRCA)。5.根据NJ树以及TMRCA的计算结果,分别绘制数据集A、B的系统发育树。结果1.数据集A的中性突变速率为7.610-6/位点天,R~2=0.98;数据集B中性突变速率为7.110-6/位点天R~2=0.92。2.计算得到数据集A的PC04的组内TMRCA是2003年11月上旬;PC03的组内TMRCA是2003年1月下旬;HP04的组内MRCA是2003年11月上旬;HP03的组内TMRCA是2003年3月上旬。数据集B的PC04的组内TMRCA是2003年10月上旬;PC03的组内TMRCA是2003年1月中旬;HP04的组内TMRCA是2003年11月上旬;HP03的组内TMRCA是2003年2月上旬;GD01的组内TMRCA是2003年4月中旬。3. CUHK-Ag01、CUHK-Ag02、GZ50的采样日期与计算得到的组内TMRCA的时间存在矛盾。4.系统发育分析结果显示不同阶段的SARS CoV的进化顺序应为:02-03年流行晚期毒株→02-03年流行中期毒株→02-03年流行早期毒株→03-04年流行毒株。结论1.通过对不同流行阶段病毒序列进行系统进化研究,03-04年流行株和02-03年流行早期株的亲缘关系较02-03年流行中晚期的更接近,与正常的进化方向相违背,说明SARS CoV在进化上出现了“逆向进化”。2. CUHK-Ag01、CUHK-Ag02、GZ50的采样日期与计算得到的组内TMRCA的时间存在矛盾说明SARS CoV的进化不完全符合进化理论。3.综上,SARS CoV的起源可能是非自然性的,是非完全动物源性的。