论文部分内容阅读
众所周知,DNA是遗传信息的载体。而mRNA是编码蛋白质的模板,携带了蛋白质的所有遗传信息。很多蛋白质三级结构具有对称性,表现为蛋白质内部拥有相似的子结构片段。从基因进化的角度上讲,这种对称性是基因复制融合的结果。很多研究表明蛋白质编码序列中密码子的选择和蛋白质结构相关。我们希望从蛋白质的编码序列中提取蛋白质三级结构对称的信息,从而进一步理解蛋白质三级结构对称的根源,为蛋白质结构预测服务。
本文从蛋白质编码序列出发,利用相似性方法,研究了蛋白质的编码序列和密码子序列与蛋白质三级结构对称性之间的关系。我们选取beta-trefoil家族和TIM-
barrel家族蛋白质作为研究对象。首先研究了beta-trefoil家族,该家族蛋白质三级结构都具有三重对称性。对蛋白质编码序列的研究发现,蛋白质编码序列有和蛋白质三级结构几乎一致的三重对称性。接着我们研究了TIM-barrel家族,该家族蛋白质三级结构主要表现为两重对称性,同时还表现为四重对称性和八重对称性。对该家族的蛋白质编码序列研究发现,所有序列中都表现出了两重对称性,部分序列还表现出了四重对称性,还有一部分序列本应该表现为四重对称性,由于基因的不断进化使得第三个相似片段消失,表现为三重对称性。两个家族蛋白质编码序列的对称性和蛋白质三级结构的对称性几乎一致。这些数据结果支持了蛋白质结构的对称性是来自于古老基因复制进化的假设。然而对两个家族的密码子序列的分析中没有发现序列上的对称性。