人类基因短编码区识别及冠状病毒酶切位点预测

来源 :天津大学 | 被引量 : 0次 | 上传用户:yangchao2005
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人类基因组及模式生物基因组大规模测序的顺利实施,GenBank,EMBL和DDBJ国际三大核酸序列数据库的序列数量和碱基个数呈指数增长,同时国际上著名的蛋白质数据库如PIR,SWISS-PROT和PDB等中的蛋白质数目与DNA序列同步,也呈指数增长.如何分析这些数据,从中获得生物结构、功能等的相关信息是基因组研究取得成果的决定性步骤.该论文主要致力于真核生物基因的蛋白质编码区识别和冠状病毒基因组多聚蛋白酶切位点的识别.论文第一部分介绍了生物信息学发展的背景和主要研究内容,真核生物基因组的特点以及真核基因识别算法的发展状况.论文第二部分是围绕人类基因的短编码区识别问题展开的.在Z曲线理论的基础上,考虑密码子内部相邻碱基之间的近程相关性,将Z曲线参数进一步发展,得到Z曲线方法的n变量,这里n=9,21,21,45,69,69,93,189.基于建立的数据库和标准评价指数,对包括马尔科夫模型在内的19种算法进行评价发现,69参数和189参数Z曲线方法在19种算法中识别准确率最高.此外,与目前国际上广泛使用的马尔科夫模型相比,Z曲线方法参数数目少,计算简单.论文第三部分主要致力于冠状病毒多聚蛋白酶切位点的预测.基于传统的权重矩阵方法,充分考虑3C-like和papain-like蛋白酶剪切位点及剪切产物的保守性,开发出了预测冠状病毒多聚蛋白酶切位点的程序ZCURVE_CoV 2.0(http:∥tubic.tju.edu.cn/sars/).类比3C-like蛋白酶的剪切模式,观察papain-like蛋白酶剪切产物的注释情况,提出了一个新的papain-like蛋白酶剪切模型,对NCBI的注释情况进行了修正和补充.论文第四部分主要是建立真核生物蛋白质亚细胞位置序列集.利用SWISS-PROT蛋白质序列数据库资源(版本号40,数据库共105,322条蛋白质记录,于2002年2月23日建立索引)建立了真核生物亚细胞位置序列集,为开发真核生物蛋白质亚细胞预测算法提供了相关基础,另外,对处于多亚细胞位置蛋白质的各种情况给予了较详细的分析.
其他文献
血管内皮细胞生长因子(VEGF)是内皮细胞特异性的促有丝分裂原,它在血管新生的过程中起着非常重要的作用。本实验采用低氧培养人脐静脉内皮细胞系ECV304细胞的模型,观察到低氧对
目的 探讨早产儿肠外和肠内营养支持期间血游离肉碱和酰基肉碱水平的动态变化及其与营养方式、胎龄和体重增长速度的关系.方法 选择2017年1~12月生后24 h内入住上海交通大学医
本文通过对荣华二采区10
期刊
近年来随着全球通信行业的飞速发展,手机、PAD以及笔记本电脑等电子产品逐渐成为日常生活的必需品,极大地刺激了市场对压控晶体振荡器的需求,也对压控晶体振荡器的相位噪声、压
克拉姆斯柯依在这幅肖像画中展示的是一位刚毅、果断、满怀思绪、散发着青春活力的俄国女性典型.这一形象的塑造具有极大的感染力,是世界美术史上肖像画的杰作。 In this po
本文以流苏石斛(Dendrobium fimbriatum Hook.)为材料,从资源调查、收集、保存、生物学性状与药用成分含量测定等方面开展流苏石斛优良种源筛选研究,为流苏石斛资源保护、品种选育以及开发利用提供依据。(1)流苏石斛生物多样性流苏石斛产地气候因子呈现出多样性,其生境也呈现多样性。流苏石斛微环境的群落因子差异较大,无论是坡度还是坡向,还是一些伴生植物、郁闭度、岩石裸露程度均呈现了较大
随着移动通信事业的发展,诸如移动电话、膝上电脑、掌上电脑和蓝牙设备等各种移动终端设备普及程度越来越高,同时人们也开始广泛关注这些移动终端设备对空间电磁环境的污染问题
随着经济水平的快速增长以及现代社会越来越信息化,计算机视觉分析理解在人们的日常生活和工作等诸多领域的应用需求也将与日俱增。研究方向重点涵盖下面几类:目标检测与分类
湿度传感器广泛应用于军事、气象、工业、农业、医疗、建筑以及家用电器等方面。论文中的湿度传感器采用铝叉指结构和聚酰亚胺感湿材料实现的电容式微型传感器。随着CMOS技术
该课题以对鞘翅目害虫,如西方五月鳃金龟、天牛、蛴螬等有明显优势的布氏白僵菌为出发菌株,首次克隆了布氏白僵菌类枯草杆菌蛋白酶Pr1基因全长cDNA,对其进行了序列分析及同源