基于结构信息和伪氨基酸组分信息预测抗凋亡蛋白质与促凋亡蛋白质

来源 :内蒙古大学 | 被引量 : 4次 | 上传用户:iris_1204
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质主宰着一切生命活动,协调着一系列复杂的生物学过程,不同类型的蛋白质行使着不同的生物学功能。其中细胞凋亡蛋白质是一种有着特殊功能的蛋白质,在生物体的生长和维持体内平衡中扮演着重要的角色。在细胞凋亡过程中抗凋亡蛋白质与促凋亡蛋白质对细胞凋亡的调控起着不同的作用。如果抗凋亡蛋白质或者促凋亡蛋白质失活,将导致癌症和其它疾病的发生。所以对抗凋亡蛋白质和促凋亡蛋白质的识别,将有助于我们更好的了解细胞凋亡的致病机理。  本文以细胞凋亡蛋白质为研究对象,在构建数据集以及寻找蛋白质序列、物理化学和结构等特征信息的基础上,运用离散增量(ID)和支持向量机(SVM)等算法,对抗细胞凋亡和促细胞凋亡蛋白质进行预测研究,主要研究工作如下:  1、首次建立了促凋亡蛋白质与抗凋亡蛋白质数据集D361。采用支持向量机算法(SVM)进行了预测,在Jackknife检验下得到了较好的预测成功率,取得了理想的预测效果。其中基于特征融合方法的Jackknife检验预测成功率普遍高于其它单一特征的预测成功率。  2、在D361数据集的基础上,我们根据Uniprot网站的更新进一步丰富了数据集D461,并且发现新数据集的正负集序列条数比上一数据集更趋于平衡。通过结合支持向量机算法(SVM)进行预测,新的数据集无论是在提取单一特征进行预测,还是融合特征信息后预测,都较前一数据集Jackknife检验预测成功率有了很大提高。  3、根据细胞凋亡蛋白质生物学特性和物理化学特性,我们提取了蛋白质如下六类特征信息:蛋白质序列信息、蛋白质亲疏水信息、蛋白质骨架信息、进化保守信息、化学位移信息、蛋白质N端序列组分信息。并分析了单一特征和多特征融合模型对预测结果的影响。  4、将离散增量算法(ID)和支持向量机算法(SVM)首次应用到促凋亡蛋白质与抗凋亡蛋白质分类预测中,并结合预测结果对两种算法进行了比较分析。
其他文献
松材线虫病,又称松树萎蔫病,主要是由松材线虫[Bursaphelenchus xylophilus (Steiner&Buhrer) Nickle]引起的松树的一种毁灭性病害。目前松材线虫病的分布区域已遍及北美洲、
幽门螺杆菌感染易引起慢性胃炎和消化性溃疡,被认为是导致胃癌发生的Ⅰ类致病菌。幽门螺杆菌的致病性主要归因于它的各种毒力因子,其中最广泛研究的是细胞毒素相关基因蛋白CagA