论文部分内容阅读
真核细胞内各种功能蛋白处在一种合成和降解的动态平衡中,以维持细胞正常生理功能。泛素介导蛋白选择性降解是一种细胞调节自身状态主动降解的过程,是胞内蛋白降解的主要途径之一。它与细胞的周转代谢、增殖分化、信号传导等许多基本活动紧密相连。通过泛素-蛋白酶体通路实现胞内蛋白质的主动识别和降解是与目标蛋白自身序列和结构特征紧密相关的。本文主要从蛋白序列特征出发,以泛素-蛋白酶体通路为依据,采用计算的方法解析胞内蛋白的稳定性,为胞内蛋白的降解机制的深入研究提供参考。论文以高通量的蛋白质组实验数据为研究对象,在对数据进行一系列的预处理后,从与蛋白稳定性相关的蛋白质物化性质、序列特征、蛋白结构、关键基序和蛋白翻译后修饰等多个角度,计算并分析了各类特征对蛋白质半衰期的影响。研究结果表明,蛋白跨膜结构、信号肽、疏水性以及某些二联氨基酸组合是与蛋白稳定性紧密相关的。在此基础上,本文提取了若干高区分度特征,利用支持向量机算法和工具建立了预测人类短寿命蛋白的模型——SProtP,并在该数据集上达到了80%的敏感性和79.3%的特异性。论文对影响胞内蛋白稳定性的几个主要特征做了重点分析,并对比经典的N-端规则证明了SProtP具有更强的预测能力。文章从特征使用量、正负样本阈值划分以及训练样本的平衡性三个模型构建角度分别讨论了模型的预测能力,使模型达到最简和最优。通过在R&S和独立数据集上的测试,验证了该模型的稳定性和推广能力。另外,文章还阐述了人类与酵母蛋白质组在稳定性研究中的保守性和进化性。最后论文还开发了人类胞内短寿命蛋白的网络预测平台。该平台采用B/S模式,前端使用HTML并结合JavaScript实现交互界面,后端采用Apache服务器和用Phython编写的CGI脚本实现蛋白序列的分析和预测。该平台的使用可以使论文的研究成果得以推广并促进学术交流。该网络预测软件的链接地址为:http://reprod.njmu.edu.cn/sprotp/index.py。