蛋白质序列新的表示方法

来源 :山东大学 | 被引量 : 0次 | 上传用户:wa1gwe52rg15
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
虽然目前生物信息学研究的核心内容是基因组学,但对蛋白质组学的研究也是生物信息学所从事的一项非常重要的工作。一方面,基因作为重要的生命信息,它需要通过表达将信息转移到蛋白质上,蛋白质才是生命活动的主要承担者;另一方面,基因组学虽然在基因活性和疾病的相关性方面为人类提供了有力的根据,但实际上大部分疾病并不是由基因改变所引发的,而蛋白质组的研究不仅能为科学家们发现生命活动的规律提供物质基础,也能为他们发现众多疾病的发病机理以及攻克这些疾病提供理论根据和解决途径。所以,随着人类基因组计划的逐步完成,科学家们又进一步提出了后基因组计划,而对蛋白质组的研究是其中一个非常重要的内容。尽管人类基因组计划已勾画出了人体的蓝图,然而,要想全面了解复杂的人体,还需要进一步深入认识基因组所产生的全部蛋白质。   蛋白质组学在生物信息学研究中的最主要任务是分析和预测蛋白质的结构,并将结构知识应用于生物学、医学、药学等生命科学领域。蛋白质的序列与蛋白质的结构之间存在着一种对应关系,这是目前进行蛋白质结构预测的一种前提性假设。基于这一前提,研究人员将通过分析比较蛋白质序列,计算序列之间的“进化距离”,从而判别蛋白质序列间的远近关系,最终找到同源蛋白质。又由于同源的蛋白质具有相似的空间结构,因此我们可以利用已知蛋白质的空间结构来推测未知蛋白质的空间结构。然而蛋白质序列的比较比DNA序列的比较更加复杂。其中一个原因是,DNA序列仅由4种碱基组成,而蛋白质序列则由20种氨基酸组成;另外,蛋白质序列不仅组成元素多,而且组成元素之间的关系比较复杂。因此,对蛋白质序列相似性关系的评价将会更加困难,而解决这一问题的关键是找到一种有效的方法来表示蛋白质序列,建立关于蛋白质序列的数学模型,用数学的方法来解决生物问题。   本文的内容可以分为两个部分:在第一部分我们将提出一种新的表示蛋白质序列的方法并且验证这种方法的有效性;在第二部分我们把这种表示方法应用到对禽流感序列的分析以及对凋亡蛋白亚细胞位置的预测这两大研究课题中,并且分别将得到的结果与用以往的分析方法得到的结果进行对比,从而得出本论文中提出的蛋白质序列新的表示方法是一种非常有效的方法这一结论。我们将用四章的篇幅阐述文章的内容。本论文的主要研究工作及创新点如下:   在第一章中我们简单介绍了生物信息学的概况及发展前景,并且说明了分析蛋白质序列作为这一学科的研究内容之一的研究意义。   在第二章中我们首先给出了一种新的方法来表示蛋白质序列,其次对于这种新的表示方法我们做了两组实验来验证这种方法的有效性,并且得到了非常理想的结果。   在第三章中,作为应用,我们首先用上述蛋白质序列的表示方法对123种H5N1的蛋白质序列进行相似性分析并且将得到的结果与用以前的分析方法得到的结果进行比较,得出了与之前的研究相似的结论。接下来我们又用蛋白质序列新的表示方法来预测凋亡蛋白的亚细胞位置,也得到了不错的预测结果。这充分体现了新方法的应用价值。   在第四章中,我们提出了本论文的不足之处并且给出了总结和展望。
其他文献
本文研究一类三次多项式Liénard系统   Liénard系统在机械振荡,化学反应,无线电电子线路,人口动力学,神经刺激和非线性力学等许多实践领域中都有着广泛的应用,它可以用
图G=(V,E)的媒体图就是顶点集为E,边集为{ef|e,f是G中两条相邻的边且在同一面内}的图,用M(G)表示.链环L是将一维平面S1上的图嵌入到三维空间E3上形成的圈的不交并.链环图D(G)是链
统计学习理论具有强大的理论基础,支持向量机(Support Vector Machine,简称SVM)作为一种常用的学习方法又是建立在结构风险最小化原理(Structural Risk Minimization,SRM)和V
随着计算机技术、存储技术和数字化技术的发展,数字图像处理技术的应用领域越来越广泛,已经渗透到各行各业。如何有效地访问和提取图像信息成为人们亟待解决的问题,于是基于
本文主要研究一类特殊的完全耦合的带反射的正倒向随机微分方程(简记RFBSDE)解的存在唯一性,以及此类方程与一类拟线性抛物型偏微分方程(简记PDE)的关系。   形如Yt=ζ+∫
矩阵保持问题主要研究从某一矩阵空间V1到另一矩阵空间V2上的保持某些函数、子集、关系、变换等不变量的映射.这类问题由于在微分方程,系统控制,量子力学和数理统计等领域有着
G是一个图, h是一个正整数,一个图G的h-限制性连通度(h-限制性边连通度)是使得G删除G中的某个点集(边集)使得G不连通且每个分支中点的度数至少是h的最小点集(边集)的基数.特