从头预测蛋白质结构元启发方法研究

来源 :苏州大学 | 被引量 : 5次 | 上传用户:zmc02302
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质因其具有特定结构而成为具体生命功能的执行者。蛋白质结构预测在基因数据高速膨胀,而结构解析成本高、效率低的情况下显得尤为重要。从头预测蛋白质结构不依赖于已知的结构模板,是蛋白质结构预测领域中一项技术难度高、现实意义深远的研究内容。   从计算机的角度来说,蛋白质结构预测本质上是一个组合优化问题,而该项组合优化问题所面临的前所未有的搜索空间与纷繁庞杂的约束机制,是计算机领域的一大挑战。本文在综述蛋白质结构从头预测以及并行元启发相关内容的基础上,着重研究了搜索空间、搜索策略、聚类方案三个方面的内容。主要研究内容包括:   1.结构预测搜索空间研究。研究了骨架预测的片段结构及生成方式,以及侧链旋转异构体的结构及生成方式。在此基础上,针对侧链旋转异构体的生成,提出一种基于动态贝叶斯网络的四层模型。该模型主要有以下两个特点:一是考虑到骨架信息以及侧链4个扭角之间的相互关联及依赖,体现出明确的推理层次,更符合蛋白质分子的生物特性;二是在每一个层次上减少了未知变量个数,降低了模型复杂度,有利于在训练数据集合不变的情况下,缓解数据稀疏现象,提高模型精度。实验表明,该四层模型获得了高质量的结果。此外,还提出一种以极端构象与随机构象评价旋转异构体库的方法,通过在CASP9的FM类数据集上进行实验,验证了方法有效性。   2.并行元启发搜索策略研究。以ACO为例,深入剖析了元启发工作原理,提出以任务分解与经验反馈为基本特点的并行元启发策略。针对从头预测蛋白质结构优化目标难以准确量化、解的构造复杂等问题,提出一种并行元启发搜索框架,融合了不同的能量函数及搜索策略。同时,结合GPCR预测详细设计了任务分配策略。基于ACO机制设计了蛋白质骨架及侧链预测算法。在骨架预测中,详细设计并实现了蚁群内搜索方案、解的构造方法、局部搜索策略以及并行分配机制。最后在Science上一篇文章所采用的16个小蛋白质数据集以及CASP8的FM类数据集上进行了实验,实验结果表明本文的方法具有很强的竞争力。   3.蛋白质结构聚类研究。主要涉及两个方面的研究:一是提出一种用于蛋白质结构聚类的聚类中心选择算法。该方法在深入研究目前常用的蛋白质结构聚类算法--QT算法与AP算法的基础上,着眼于利用统计信息来提高发现最优构象的能力,克服了原有算法受限于具体参数的弊端。二是提出利用能量信息优化结构相似性矩阵的分布特性,提高相似性矩阵对蛋白质天然状态的表现能力,为聚类算法的工作奠定良好基础。最后在两个权威数据集上进行了实验,实验结果表明本文的方法能够针对特定数据集合有效提高聚类性能,从而选择到更加接近天然构象的候选结构。   本文的创新点主要表现在:提出了用于生成侧链旋转异构体库的四层推理模型,该模型充分考虑到骨架与侧链之间的相互关联及依赖关系,并在降低模型复杂度、缓解数据稀疏方面做了合理设计;提出适合蛋白质从头预测的并行元启发方案,在骨架预测中取得了明显效果;提出用于蛋白质结构聚类的聚类中心选择算法以及相似性分布优化方案,提高了搜寻最优构象的准确率。   实验表明,这些研究对蛋白质结构从头预测起到了积极的推进作用,对后续相关研究有重要参考价值。
其他文献
随着IT技术的飞速发展,社会的信息化进程也在逐渐加快。社会信息化一方面给人们带来了极大的方便和快捷,另一方面也带来了一些问题和挑战。其中“信息孤岛”和数据访问就是较
大数据文件越来越普遍,图像领域也是如此,随着医学、航空、生物科技等领域专业技术的快速发展,几十兆、几百兆的高精密高像素图像往往才能满足行业对精度和数据量的需求。大图像
随着现代物流业的快速发展,物流信息量增长迅速、客户数量不固定且位置分布散乱等问题给物流企业管理和决策提出新的挑战。传统的企业物流配送系统不仅不能实现对客户和车辆
无线传感器网络做为一种新型的信息获取平台,在卫生医疗、环境监控、工业生产监控等领域得到越来越广泛的应用,它具有感知、运算、存储和无线通信的能力,它能够通过自组织方
随着计算机和网络技术的迅猛发展,人们的社会活动越来越依赖于通信网络。这就需要提供和支撑这些数据交互的网络平台具有更高的可靠性和稳定性。通信的载体光纤具有通信容量
随着互联网技术的快速发展,海量、异质的数据信息呈指数级增长。各种信息对象在不同层次、不同维度,以不同方式互相影响,从而组成了复杂的网络。用户很难从这些海量信息中快速找
移动Ad hoc网络是一种无中心、自组织、可快速展开、可移动对等式网络,在战场、救灾等特殊场合具有很大应用价值。分布式对等网络应用愈广,安全通信需求不断增加。网络结构、
2003年的亚密会议上,Al-Riyami和Paterson提出了一种新型的公钥密码体制称为“无证书公钥密码体制”[1]。在无证书公钥密码体制中,密钥生成中心不能获知任何用户的私钥。它既
中药制药的过程当中药材的提取是一个非常重要的工序。由于在提取药材时是在一个封闭的容器当中进行的,因此常规的提取方法很难判断出容器当中物料和溶剂的分布,以及浓度等相
隐蔽通道属于信息隐藏的分支学科,它的概念形成于三十多年前,在经历了最初的一段研究热潮之后,对于隐蔽通道的研究一段进入低谷。但随着近年来互联网的迅速普及和发展,人们开