论文部分内容阅读
蛋白质-蛋白质相互作用与识别的研究是分子生物学领域的重要课题。由于实验测定蛋白质复合物结构比较困难,因此,通过计算机模拟预测分子间结合模式的对接方法受到极大关注。分子对接的最终目的是通过计算机模拟预测未知复合物结构的受体和配体之间的结合情况。然而,在蛋白质-蛋白质对接中,体系原子数和自由度数的增加使模拟复合物形成中的构象变化十分困难。另外,搜索过程可能产生数百万的对接构象,在用精细的能量函数打分之前,如何对这些结构进行初步筛选以得到尽可能多的近天然构象是目前方法研究中极具挑战性的问题。本文首先在深入研究蛋白质对接理论的基础上,给出了一种快速有效的蛋白质-蛋白质对接方法,使用一种基于信息熵的蛋白质对接演化模型,包括传统对接模型的优化目标,以及由信息熵组成的目标函数。信息熵用于衡量优化过程中最优解出现在哪一个种群中的不确定性,随着优化过程向最优解的逼近,这种不确定性逐步消除,伴随着最优解的达到熵减为最小值零,并通过研究用遗传算法解决问题所用到的关键技术,提出了基于多种群的遗传算法解决蛋白质对接问题的思想,用遗传算法对该模型进行了求解。其次,在对蛋白质对接结构进行过滤时,使用几何匹配过滤结合界面残基成对偏好性的双重过滤技术,使筛选到的近天然结构数目明显增多,提高了对蛋白质分子间识别预测的成功率;使用打分函数的目的,是在合理的时间内对结构做出有效评价,以区分出近天然构象。很多对接算法所使用的打分函数是基于热力学假设,即天然蛋白质复合物的结构是结合自由能最低的构象。因此,发展一个计算快且足够准确的结合自由能计算方法是结构预测中十分重要的一步。本文通过对蛋白质对接过程中,蛋白质间的静电相互作用和去水化自由能的分析,采用基于自由能的打分函数,合理地评价正确与错误的对接结构,对近天然构象做出了有效区分。最后,本文设计和实现了一个简单的蛋白质对接的图形模拟系统,进一步验证了论文中给出的算法的可行性和有效性。