论文部分内容阅读
生命科学已经成为21世纪科学发展的前沿领域,人类基因组计划已进入后基因组时代,有关结构基因组学和功能基因组学的研究带动了蛋白组学和代谢组学的发展,并催生了生物信息学等相关学科。利用生物信息学的知识,已有可能在DNA的核苷酸序列中确定蛋白编码基因,得到蛋白质的氨基酸序列,进而预测蛋白质的三维结构,确定药物分子的靶标,进行以分子结构为基础的直接药物设计。我在硕士学位研究中参加了导师领导的有关研究,学习了生物信息学的基础理论知识,获得实际应用的经验。 核酸和蛋白质的序列以及蛋白质结构数据是生物信息学的主要研究对象。由于测序技术的快速发展和蛋白质结构测定技术的相对滞后,使得现在分子数据库中的一级序列数据量,与已测定的结构数据量形成了巨大的反差。所以理论预测蛋白质的结构尤为重要。我在学位研究中参加了蛋白质的氨基酸残基的相关性分析法(AACA)的研究。该方法以20种氨基酸残基在蛋白质中的百分组成为基础,找出某一类蛋白质中20种氨基酸间的相关性规律,作为蛋白质类型预测的指标,预测未知蛋白质的类型。用该方法研究了4种类型蛋白质的204个样品中的氨基酸残基的相关性系数,找出了可作为蛋白质结构类型特征的氨基酸残基的相关对,并用于蛋白质结构类型的预测,对于α型、β型、α/β型和α+β型蛋白质的204个蛋白质样品的交叉测试,正确率分别为94%、89%、79%、89%,平均为88%,高于简单距离法和欧几里德距离法。 我参加了导师领导的抗非典型肺炎药物的研究,把生物信息学用于SARS冠状病毒主蛋白酶抑制剂药物的研究。用冠状病毒的基因解析软件系统ZCURVE-CoV 1.0和ZCURVE-CoV 2.0(http://tubic.tju.edu.cn/sars/)分析了基因库(NCBI RefSeq project)中的36个不同来源的SARS冠状病毒的RNA基因序列,找出了主蛋白酶(CoV Mpro)在聚蛋白ppla和pplab中的396个酶切位点。在此基础上找出了11个SARS冠状病毒主蛋白酶的可切割八肽,因为这些八肽都含有SARS CoV Mpro的真实切割点,因而是发展SARS CoV Mpro的多肽类抑制剂的适宜出发点。计算了可切割八肽在特异性位点R4、R3、R2、R1、和R1′上的氨基酸的概率分布,发现位点R4和R3也有一定的特异性。分析了这些位点上的氨基酸的结构特征,确定了最有希望成为SARS CoV Mpro的多肽类抑制剂的两个八肽NH2-ATLQ↓AIAS-COOH和NH2-ATLQ↓AENV-CDOH。