用贝叶斯网络对蛋白质LOOP结构建模的研究

来源 :苏州大学 | 被引量 : 0次 | 上传用户:dhy333
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
根据蛋白质的氨基酸序列预测蛋白质的结构是计算生物学中尚未解决的重要问题之一,而该问题的一个难点是蛋白质中Loop片段的结构。Loop在蛋白质的特征和功能中起着关键作用,但是用实验方法确定Loop结构,因其活性相对较大而变得异常困难。因此,尽可能精确地对Loop的结构进行计算建模,对于了解蛋白质整体结构来说是非常重要的。   本文用生成式概率模型贝叶斯网络为蛋白质Loop建模,用连续型二元VonMises分布来描述Loop的骨架结构。用氨基酸信息作为显式控制Loop结构二面角对的原因变量。为了验证蛋白质Loop结构上连续建模的可行性和有效性,采用了二元Von Mises分布构建贝叶斯网络结构固定的LoopMM模型。从SABmark中提取的Loop段的训练集上学习,并采样得到连续的二面角对。在CASP8中自由建模蛋白质的Loop结构上的实验也显示出LoopMM采样得到二面角对比其他方法更接近天然态的Loop二面角对。   将LoopMM中固定的网络结构释放,从训练集中进一步学习出新的贝叶斯网络结构,即允许远距离多个氨基酸残基或二级结构联合决定某个残基的二面角节点,新学习到的贝叶斯网络LoopBN模型不仅能采样到更接近Loop天然结构的二面角对,而且在从头预测这些蛋白质整体结构时能提高准确度。   用贝叶斯网络来预测蛋白质Loop结构,一方面为提高结构预测的精度提供了新的计算模型,另一方面还能描述蛋白质Loop结构中一些潜在的因果关系:Loop结构中不同残基的氨基酸和二级结构信息对二面角取值的因果关系可以由贝叶斯网络结构图上的边直接展现出来,为计算作为手段来解决生物等目标问题提供了易理解,易解释的科学发现。
其他文献
随着无线传感器网络(Wireless Sensor Network,WSN)在多领域的深入应用,WSN的重要性和前景变得越来越明确。WSN节点有限的运算能力和有限的能量等问题,吸引了来自不同学科的科研
随着Internet的迅速发展与普及,网络上出现了越来越多的主观性言论。对于这些主观性文本的分析和挖掘,传统的基于主题的文本分类方法已经无法满足需求。因此,人们开始关注并
指纹识别算法是目前高效、应用广泛的识别算法之一,是生物特征识别领域的研究热点之一。在公安、金融电子商务、政务、司法等领域有着广泛的应用。指纹识别具稳定性,唯一性,安全
随着计算机和通信技术的迅猛发展,网络也正朝着大规模、高度分布式的方向发展,同时计算机系统及其网络的被入侵行为也朝着规模化、分布化、复杂化等方向演化。由于各种网络安
车牌识别系统、(License Plate Recognition System,LPRS)是智能交通系统(Intelligent Transport System,ITS)一个重要组成部分。随着我国经济的飞速发展,汽车的总量也大幅度
k-近邻(KNN)算法是一种简单而有效的分类算法。传统的KNN分类算法存在着参数k难以确定以及分类新数据时间耗费大的两个缺陷。kNN模型算法(简记KNNModel)是一种基于KNN原理的
某眼镜连锁销售店在日常销售中应用连锁零售销售系统,积累了大量的销售数据,但该系统只支持极其简单的统计查询,无法进行商品关联性、销量和利润预测等分析。因此,本文对该企业原
数据发布中的隐私保护是将数据发布与隐私保护技术相结合,在保护隐私的前提下,发布较为准确的数据,提高信息的利用水平。匿名化限制发布是其主要的技术实现手段。当前以数据
随着Web应用的普及,Web应用程序漏洞以越来越快的速度爆发出来,针对Web应用程序漏洞检测技术的研究正逐渐成为国内外研究的重点和热点。本文介绍了已有的Web应用程序漏洞及其带
H.264是ITU-T的视频编码专家组与ISO/IEC的动态图像专家组联合开发的最新视频编码国际标准。与以前的H.263、MPEG-X等编码标准不同,H.264增加了多模式运动估计、帧内预测、变