论文部分内容阅读
在生物世代遗传信息传递的过程中,对遗传信息进行有效的编码和解码十分重要。密码子指的是mRNA链上决定一个氨基酸的相邻的三个碱基,因此也叫做三联体密码子。密码子有很多特点,一直以来都是基础和合成生物学研究的热点。研究人员发现20种常用氨基酸对应了61种密码子,除了甲硫氨酸和色氨酸外,每一种氨基酸都对应多个密码子,这使得密码子具有简并性。然而科学家发现在不同物种中,同义密码子的使用并不是随机的,某些物种更偏向于使用某几种密码子,这就造成了密码子的使用偏好性。在系统发育和进化研究中,密码子偏好性经常被用作衡量种间差异性的一个指标。此外,在合成生物学研究中,利用密码子偏好性,对基因进行编码优化,使用宿主细胞偏好的密码子替换外源基因的密码子,可提高外源基因在宿主中的表达量。除了密码子优化,还有利用密码子弱化来制备减毒疫苗的成果案例。因为此类研究具有广阔的应用前景,近年来提出了很多密码子分析的量化指标,如相对同义密码子使用度(RSCU)、有效密码子数(ENC)、密码子适应指数(CAI)、ENC-GC3s绘图分析、PR2绘图分析、密码子对偏好系数(CPB)等等。但是,目前很多的指标都没有成熟的软件可以分析,有些指标需要用户自己编写程序,这对很多科研人员造成一定的困难,阻碍了研究的发展。基于以上的原因,本研究通过文献搜集,找出了目前学术界常用和最新提出的密码子分析指标和分析内容,使用python脚本实现了所有的分析内容,并基于Django这个框架搭建了一个密码子分析优化平台,供广大科研人员使用。该平台操作方便,功能齐全,并与时俱进地增加新的分析模块,为密码子分析提供便利。此外,本研究还开发了一种基于密码子对的优化算法,并将其整合入密码子优化模块中,为密码子优化提供新的思路。在本论文的最后,通过两个实例,来展示使用本密码子分析优化平台的优势。其中实例一展示了使用密码子分析功能可以快速完成对三种植物的全基因组密码子偏好性分析,并给出比较结果图。实例二展示了利用密码子优化平台的功能优化目标基因序列,提高其表达量,并发现本研究中实现的基于密码子对的优化相较传统的单密码子优化具有更大的优势。