人类基因短编码区识别及冠状病毒酶切位点预测

来源 :天津大学 | 被引量 : 0次 | 上传用户：yangchao2005

【摘要】

：

随着人类基因组及模式生物基因组大规模测序的顺利实施,GenBank,EMBL和DDBJ国际三大核酸序列数据库的序列数量和碱基个数呈指数增长,同时国际上著名的蛋白质数据库如PIR,SWIS

【作者】

：

高峰

【机构】

：

天津大学

【出处】

：

天津大学

【发表日期】

：

2003年期

【关键词】

：

Z曲线真核生物基因组基因识别 SARS冠状病毒基因组多聚蛋白剪切位点蛋白质亚细胞位置

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着人类基因组及模式生物基因组大规模测序的顺利实施,GenBank,EMBL和DDBJ国际三大核酸序列数据库的序列数量和碱基个数呈指数增长,同时国际上著名的蛋白质数据库如PIR,SWISS-PROT和PDB等中的蛋白质数目与DNA序列同步,也呈指数增长.如何分析这些数据,从中获得生物结构、功能等的相关信息是基因组研究取得成果的决定性步骤.该论文主要致力于真核生物基因的蛋白质编码区识别和冠状病毒基因组多聚蛋白酶切位点的识别.论文第一部分介绍了生物信息学发展的背景和主要研究内容,真核生物基因组的特点以及真核基因识别算法的发展状况.论文第二部分是围绕人类基因的短编码区识别问题展开的.在Z曲线理论的基础上,考虑密码子内部相邻碱基之间的近程相关性,将Z曲线参数进一步发展,得到Z曲线方法的n变量,这里n=9,21,21,45,69,69,93,189.基于建立的数据库和标准评价指数,对包括马尔科夫模型在内的19种算法进行评价发现,69参数和189参数Z曲线方法在19种算法中识别准确率最高.此外,与目前国际上广泛使用的马尔科夫模型相比,Z曲线方法参数数目少,计算简单.论文第三部分主要致力于冠状病毒多聚蛋白酶切位点的预测.基于传统的权重矩阵方法,充分考虑3C-like和papain-like蛋白酶剪切位点及剪切产物的保守性,开发出了预测冠状病毒多聚蛋白酶切位点的程序ZCURVE_CoV 2.0(http:∥tubic.tju.edu.cn/sars/).类比3C-like蛋白酶的剪切模式,观察papain-like蛋白酶剪切产物的注释情况,提出了一个新的papain-like蛋白酶剪切模型,对NCBI的注释情况进行了修正和补充.论文第四部分主要是建立真核生物蛋白质亚细胞位置序列集.利用SWISS-PROT蛋白质序列数据库资源(版本号40,数据库共105,322条蛋白质记录,于2002年2月23日建立索引)建立了真核生物亚细胞位置序列集,为开发真核生物蛋白质亚细胞预测算法提供了相关基础,另外,对处于多亚细胞位置蛋白质的各种情况给予了较详细的分析.

其他文献

血游离肉碱和酰基肉碱水平在早产儿营养支持中的动态变化

目的探讨早产儿肠外和肠内营养支持期间血游离肉碱和酰基肉碱水平的动态变化及其与营养方式、胎龄和体重增长速度的关系.方法选择2017年1～12月生后24 h内入住上海交通大学医

期刊

CarnitineNutritional SupportInfantprematureWeight gain

高校图书馆管理信息系统的设计与实现

本文通过对荣华二采区10

期刊

《无名女郎》

克拉姆斯柯依在这幅肖像画中展示的是一位刚毅、果断、满怀思绪、散发着青春活力的俄国女性典型.这一形象的塑造具有极大的感染力,是世界美术史上肖像画的杰作。 In this po

期刊

无名女郎克拉姆斯柯依世界美术史青春活力

流苏石斛优良种源筛选研究

本文以流苏石斛（Dendrobium fimbriatum Hook.)为材料，从资源调查、收集、保存、生物学性状与药用成分含量测定等方面开展流苏石斛优良种源筛选研究，为流苏石斛资源保护、品种选育以及开发利用提供依据。（1）流苏石斛生物多样性流苏石斛产地气候因子呈现出多样性，其生境也呈现多样性。流苏石斛微环境的群落因子差异较大，无论是坡度还是坡向，还是一些伴生植物、郁闭度、岩石裸露程度均呈现了较大

学位

流苏石斛品种选育组培快繁仿野生种植

智能视频监控中人体运动的检测与跟踪算法研究

随着经济水平的快速增长以及现代社会越来越信息化,计算机视觉分析理解在人们的日常生活和工作等诸多领域的应用需求也将与日俱增。研究方向重点涵盖下面几类：目标检测与分类

学位

智能视频监控人体目标三帧差分算法Meanshift算法Kalman滤波

人类基因短编码区识别及冠状病毒酶切位点预测

其他学术论文