论文部分内容阅读
蛋白质组学是当前生命科学的新前沿,通过研究蛋白质的功能、结构、相互作用来系统地分析蛋白质,进而分析生命活动,成为热点的研究问题之一。尤其是,从蛋白质网络中识别蛋白质复合物对揭示蛋白质网络的组成结构、预测蛋白质功能、解释特定的生物进程具有重要的研究意义。
静态蛋白质网络中的大量蛋白质相互作用数据是在不同条件和时间下积累而来的,从而不能精确反映细胞内部真实的动态变化,进而影响蛋白质复合物识别的准确性。本文针对静态蛋白质网络的缺陷,提出了一种基于3-sigma法则来识别蛋白质活性时刻点,并将蛋白质活性时刻点与静态蛋白质网络相结合构建了动态蛋白质网络的方法。为评估该网络的性能,用MCL算法在该网络上预测蛋白质复合物,同时也比较了算法在其他两种网络上预测蛋白质复合物的结果。结果表明,我们构造的动态蛋白质网络是一个能够更精确地反映真实的动态变化的网络,从而能够使算法更加准确地识别具有特定生物意义的蛋白质复合物。
基于拓扑特性和功能相似性的蛋白质识别算法忽略了蛋白质复合物形成的过程以及复合物的内部特征,本文从蛋白质复合物形成过程以及蛋白质活性状态出发,提出了一种基于just-in-time机制和蛋白质活性的蛋白质复合物提炼方法。用该方法对已知算法预测的蛋白质复合物进行提炼,实验结果表明提炼后蛋白质复合物在识别已知复合物的能力上以及准确性上都有较大的提高。基于just-in-time机制和蛋白质活性的蛋白质复合物提炼方法能够更加准确地描述蛋白质复合物内部的特征,这也进一步验证了生物特性在蛋白质复合物识别研究中具有极其重要的作用。
本文提出的动态蛋白质网络构建方法及蛋白质复合物提炼方法从不同角度出发,有效地解决了静态蛋白质网络中蛋白质复合物识别过程中存在的一些问题,使得识别的蛋白质复合物更具有生物意义的,对生物实验具有积极的指导意义。