改进的系统发育谱方法在蛋白质功能预测中的应用

来源 :东北师范大学 | 被引量 : 2次 | 上传用户:hnxmyuandong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
后基因组时代的到来,生物信息学的研究重心日益从基因组测序工作转移到对已测序基因组的功能进行注释。传统的基于同源性的注释方法由于自身存在的缺陷在精确度方面已经不能满足人们的需要。非同源性的功能注释方法渐渐受到人们的重视。有别于同源性方法中对基因或蛋白质间相似性的考虑,非同源性方法则是根据基因或蛋白质之间的进化上的相关性来预测它们之间的功能关联。在众多非同源性方法中,系统发育谱方法是应用得最为广泛的一种,同时也是最具研究价值的一种。 系统发育谱方法最早是由Pellegrini等人于1999年提出的。该方法从刚一提出就引起人们的广泛关注。在此后的几年时间里,众多研究学者对这种方法做出了不同程度的改进。这些改进包括了系统发育谱的三个步骤,即参照基因组的选择、系统发育谱的构建以及谱的相似性分析。尽管如此,该方法到目前为止还有许多不足之处,如参照基因组的选取还没有一定的标准,对相似谱的聚类也还没有有效地利用现有的经典聚类算法。针对这些不足,对系统发育谱算法提出了两点改进:一是为构造基于权重的系统发育谱,从而间接减少了对于参照基因组选择的过分依赖;二是在对构造好的发育谱进行相似性分析时,结合使用两种应用最为广泛的经典聚类算法——层次聚类算法和K均值聚类算法。通过两种方法的取长补短来达到更好的聚类效果。
其他文献
Internet的飞速发展为用户提供了丰富的信息资源,同时也促进了信息处理技术的崛起。通过信息处理技术,可以帮助人们更加有效地组织、总结和分析网络上的各种资源。而这当中,
如同硬件系统需要一条系统总线连接各个部件一样,分布式系统也需要一条软件总线连接各个节点,为分布式系统提供可靠的通信服务。消息中间件就是分布式系统中的软件总线,为分
随着Internet技术的高速发展,Web已经成为人们获取信息的一个重要途径,由于Web上的文本信息日益增长,如何有效地检索用户所需的信息成为一个非常重要的研究课题。万维网WWW(W
目的了解昆明市HIV感染者病耻感现状,并分析产生病耻感的原因及影响因素。方法采取系统抽样的方法,从昆明市现存活的HIV感染者中抽取样本进行调查,调查内容包括一般人口学资料、HIV防治相关知识及艾滋病相关的病耻感,其中,HIV感染者的病耻感采用简化艾滋病耻辱量表(BHSS量表)进行调查。结果共调查962例HIV感染者,其中男696例,女266例,BHSS量表平均得分为(11.29±3.35)分,汉族
起源于幼发拉底河和底格里斯河,以现代伊拉克和北叙利亚为中心的古西亚两河流域是人类文明的发祥地之一,从这一地区出土的数以万计的楔形文字文献是目前所知的世界上数量最多
网格就是一个集成的计算与资源环境,网格环境中,资源是分布在不同地理位置上的,由不同的组织或者个人拥有和操作,资源所有者对资源有绝对的权力,网格对其管理必须满足本地的管理策
本文提出了一种在含有带关节模型的数据库中检索三维形状的方法。首先,针对每一个形状都基于谱嵌入的方法求得其相应的谱嵌入表示,这里的谱嵌入是基于以近似测地距离为基础构
目的探讨流感样病例与气象因素、空气质量因素的相关关系,用时间序列分析法构建流感样病例预测模型,对流感预警预测技术进行有效探索。方法收集2014年至2017年呼和浩特市流感样病例监测资料及同期气象资料和空气质量因素资料,分析流感样病例与气象因素和空气质量因素的相关性,建立该地区流感样病例季节性自回归移动平均(seasonal autoregressive integrated moving aver
随着计算机网络的迅速发展,人们希望通过电子设备实现快速、远距离的交易,数字签名应运而生,并开始应用于现实社会中。数字签名已经在信息保密、身份认证、数据完整性、不可