论文部分内容阅读
在生物体内,关键蛋白质是生命活动重要的物质和功能基础,生物体得以正常生存与繁衍都离不开关键蛋白的参与。正确识别关键蛋白质不仅有助于理解生物体的运作机理,而且对于疾病诊断以及药物靶标的研究也具有极其重要的指导意义。近年来,随着信息技术的高速发展,利用计算生物学的方法从蛋白质相互作用(PPI)网络中挖掘关键蛋白质成为了蛋白质组学一项极其重要的研究内容。早些年,国内外主要是通过生物实验的方法来对蛋白质相互作用进行研究。随着计算科学与技术的不断发展,利用计算机仿真的技术手段来对PPI网络进行预测和分析成为了生物信息学主流的研究方向。但由于细胞内在环境的复杂性以及相关技术手段的局限性,通常情况下,获得的蛋白质相互作用数据存在有高度假阳性和假阴性。而且,蛋白质之间的相互作用随着时间、环境以及不同的细胞周期在不断进行动态变化,因此,蛋白质相互作用数据并不能反映细胞内真实的蛋白质相互作用。这严重妨碍了从PPI网络中挖掘关键蛋白质的准确性。本文将蛋白质相互作用网络的拓扑特性与蛋白质的多种生物特性进行有效融合,并采用随机游走模型和智能优化算法的优化机理进行关键蛋白质预测研究。本文的主要研究工作包括:(1)提出了基于复合物参与度和局部子图密度的方法预测关键蛋白质。在对原始PPI网络进行提纯处理的基础上,先后通过三次信息融合,将蛋白质的拓扑特性与生物特性进行结合,根据最终得分预测关键蛋白质。仿真实验结果表明新的基于信息融合的中心性方法比传统的中心性方法能够更为精确地预测关键蛋白质。(2)提出了基于重启随机游走模型的方法预测关键蛋白质。首先,利用边聚集系数、基因表达和GO注释信息对原始PPI网络进行加权处理,利用亚细胞定位和蛋白质复合物信息初始化蛋白质得分,然后在加权的PPI网络上执行重启随机游走算法,当算法终止时,得到最终的蛋白质得分向量,据此预测关键蛋白质。仿真实验结果表明新的基于重启随机游走模型的预测算法比其它几种方法有着更好的关键蛋白质预测性能。(3)提出了基于人工鱼群算法优化机理的方法预测关键蛋白质。首先,基于已知关键蛋白质对人工鱼群进行初始化,将已知关键蛋白质作为关键蛋白预测的先验知识。然后,将人工鱼群算法中的觅食行为、随机行为、追尾行为以及聚群行为与关键蛋白识别问题一一对应,从而获得预测的关键蛋白质候选集。仿真实验结果表明基于人工鱼群算法机理的关键蛋白质预测模型比传统方法能够更为准确地预测关键蛋白质。(4)提出了基于免疫算法优化机理的方法预测关键蛋白质。将候选的关键蛋白质集合视作抗体。通过遗传算子以及免疫算子的执行对抗体种群进行迭代更新,当算法终止时,获得预测的关键蛋白质。仿真实验结果表明基于免疫算法优化机理的关键蛋白质预测模型比传统方法能够取得更好的预测效果。