论文部分内容阅读
蛋白质翻译后修饰与蛋白质多样性、功能调节、信号传导和人类的疾病都有着密切的关系。迄今为止,人们发现了超过200种的蛋白质翻译后修饰类型,常见的并被主要的蛋白质翻译后修饰数据库收录的也有超过60种类型。现在对于蛋白质翻译后修饰的研究集中在鉴别、反应机制及其特征富集几个方面。一些非氧化还原类或酶催化的翻译后修饰,如:磷酸化、泛素化和乙酰化等,其翻译后修饰过程的反应机制较明确,因此,序列上的特征明显。然而,氧化还原类的翻译后修饰,包括:酪氨酸硝化和半胱氨酸硫代亚硝化,反应机制复杂,至今提出了多种与自由基相关的机制,序列上没有明显特征,因此,对于此类翻译后修饰的分类和预测处于较低的水平。氧化还原类翻译后修饰在生物体中通常扮演着重要的角色,如:硝化过程与磷酸化过程竞争、炎症反应、NO信号转导和蛋白质功能的调节(失活)。因此,解析氧化还原类翻译后修饰蛋白质的特征并发现潜在的修饰蛋白质具有重要的意义。在已经报道的研究中,从序列角度探讨蛋白质翻译后修饰的特征并进行预测,在磷酸化、乙酰化、泛素化等翻译后修饰中得到了较好的应用,然而,对于氧化还原类蛋白质翻译后修饰,如酪氨酸硝化、半胱氨酸亚硝化,则使用序列不能很好的解释其修饰特征,因此,本文从结构出发,探讨这二类蛋白质翻译后修饰的结构特征,并根据主要特征对这二类翻译后修饰进行预测。 在蛋白质晶体学的研究中,大量的蛋白质晶体结构数据积累了下来。在蛋白质晶体PDB数据库中,有超过90,000个晶体结构。基于蛋白质结构上的保守性高于序列保守性的特性,本文从结构上研究氧化还原类翻译后修饰,探索这类翻译后修饰在结构上的特征。 本文内容主要包括二大部分: 第一部分内容为翻译后修饰数库的构建与氧化还原类蛋白质翻译后修饰的结构生物信息学研究。首先,通过序列信息搜索到相应的结构数据,构建了数据库(第二章);在此基础上,对酪氨酸硝化(第三章)和半胱氨酸硫代亚硝化(第四章)的研究。通过对硝化蛋白质和亚硝化蛋白质中硝化/亚硝化位点的近邻原子分布、氨基酸对、氨基酸三角、表面可及性、pKa和空间位阻效应等结构特征分析,计算结构特征的差异度并进行非参数检验,结果发现:酪氨酸硝化的过程与其周围分布的氨基酸种类相关,脂肪族和芳香族残基,特别是体积大的芳香族、脂肪族是不利于硝化。通过改进的Maximal dependence decomposition聚类方法,构建了硝化酪氨酸的预测模型,预测模型取得了63.30%的敏感性和92.24%的特异性,比只使用蛋白质的序列信息模型更准确。半胱氨酸周围氨基酸的分布、所在区域的柔性、碱性环境和空间位阻效应影响了其硫代亚硝化过程。由于血红蛋白的亚硝化或去亚硝化现象完全与R/T变构相关,即R构型时发生亚硝化,T构型时去亚硝化,因此,使用血红蛋白进行分子动力学模拟来进行验证。结果发现,硫代亚硝化半胱氨酸具有更大的柔性、空间位阻较小并且处于相对碱性的环境中,这些都是通过结构的改变来实现的。综合可知,氧化类翻译后修饰在结构上具有更明显的特征,并且结构的改变、氨基酸分布的改变都会影响硝化/亚硝化的过程。 第二部分内容为蛋白质氨基酸拓扑网络的引入,对比研究了构建蛋白质氨基酸拓扑网络的方法,并提出了鲁棒性更高的拓扑网络构建方法(第五章),即使用原子的范德华半径作为距离阈值构建的网络,网络中包含了氨基酸的物化性质信息和蛋白质的结构信息。在蛋白质氨基酸拓扑网络的基础上,发展了二种拓扑网络比对算法(第六章),通过网络比对算法来评估蛋白质功能位点(本文中为翻译后修饰位点)的相似程度,实现对具有相似功能的位点的预测功能。