论文部分内容阅读
蛋白质翻译后修饰改变蛋白质的生化特性,在细胞生理过程中发挥着举足轻重的作用。由于现有实验技术的局限性以及相关数据不足导致仅有很少的几种在翻译后修饰得到较为系统的研究。传统的实验方法,如定点突变、质谱分析和肽段文库等常常需要耗费大量的时间和精力,从而严重制约了相关研究的进展。利用生物信息学的方法开展预测,能够有效的预测潜在修饰底物和位点,为进一步的实验验证提供有价值的参考信息。 在过去的两年里,我的主要研究工作是Caspase介导的切割修饰的生物信息学分析。Caspase(Cysteineasparticacidspecificprotease)为半胱氨酸天冬氨酸特异性蛋白酶,能够切割靶蛋白特定的天冬氨酸位点。Caspase在许多关键生物过程中起到了重要的作用,如细胞凋亡、分化、增殖、坏死和炎症。在哺乳动物中至少发现15种Caspases,根据结构和功能可分为三类。第一类为炎症相关Caspase(Caspase-1、-4、-5和-13);第二类为启动凋亡Caspase(Caspase-2、-8、-9和10);第三类为效应凋亡Caspase(Caspase-3、-6和-7)。目前虽然已有一些Caspase预测工具发表,但由于训练数据有限,其预测性能仍有待提高。本论文中,我们通过阅读科学文献,收集了580个实验验证Caspase底物的946个切割位点。利用位置特异性打分矩阵(PSSM)对这些数据进行训练,并使用“除一法”(Leave-one-outvalidation)等方法评估其预测性能,发现其特异性(Specificity)在85%、90%和95%时,相应的灵敏度(Sensitivity)分别为88.77%、84.76%和71.12%。与已有的工具相比,我们的方法获得了更高的准确性。我们利用Weblogo分析了Caspases的切割位点,发现Caspase偏好识别D-E-V-D-(G/S/A)模体。我们对Caspases底物做了GO(GeneOntology)分析,发现了Caspases底物不仅与凋亡和炎症有着密切关系,还参与了很多的信号通路,并且Caspase底物主要集中在细胞质和细胞核中。此外,我们分析并预测了Caspase-3特异性的底物和位点,其预测性能比已有的工具准确。虽然Caspase-3也偏好识别D-E-V-D-(G/S/A)模体,但相对于Caspase家族,其在P4、P3和P2位置上D、E和V的特征更强。最后,我们对六个物种进行了大规模预测,发现Caspase切割修饰在真核生物中广泛存在,并且随着物种由低等到高等,Caspase切割蛋白的比例逐渐增加。综上所述,我们对Caspase切割修饰所做的系统性分析可为进一步的实验提供有用的数据资源,我们相信,生物信息分析与实验验证的有机结合可将Caspase切割修饰的研究带入一个新的发展阶段。