基于概率图模型HMM的蛋白质二级结构预测

来源 :河北科技大学 | 被引量 : 1次 | 上传用户:tian_mizhen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质结构与蛋白质功能密切相关,而蛋白质二级结构又是其他更高阶空间结构形成的基础,因此,蛋白质二级结构预测成为生物信息学研究的热点。蛋白质二级结构预测是根据已知二级结构的蛋白质数据建立氨基酸序列和二级结构间的关系模型,进而通过模型来预测未知氨基酸序列的二级结构。隐马尔可夫模型(Hidden Markov Model,HMM)是一种概率统计模型,一些国内外学者将其应用到蛋白质二级结构预测问题上,收到了一定的效果。该文首先利用3-状态HMM和7-状态HMM对蛋白质二级结构进行预测,通过比较得出7-状态HMM的预测效果要优于3-状态HMM。对于7-状态HMM预测算法,又从结构状态和参数训练两方面提出了改进方案。一方面,考虑到7-状态HMM没有包含非二级结构的状态,故引入非二级结构的状态,进而构成8-状态HMM;另一方面,对于参数重估过程的第二种下溢情况,我们打破常规,并没有通过某种手段阻止其下溢,而是用最优重估一次参数的均值作为预测二级结构的模型参数。我们通过这两种改进方案在一定程度上提高了预测准确率。该文的研究表明,选取合适的蛋白质结构状态以及合适的训练集对提高蛋白质二级结构的预测准确率是比较重要的。
其他文献
电子档案数据的法律证据价值在实际工作中常常受到质疑,这对于档案机构的职能发挥带来极大影响。采用Hash函数析出数字摘要文件并保全,能够对电子档案的法律证据价值起到很好
<正> 一、博物馆教育在博物馆中的地位所谓博物馆教育是指博物馆运用文物标本向大众实施的教育工作。博物馆教育是社会教育的一种方式。学校教育、家庭教育、社会教育是并驾
本文研究求解大规模反对称矩阵特征问题的广义Lanczos方法.本学位论文共分四章.第一章介绍大规模反对称矩阵特征问题的来源,解决这类问题的基本方法以及与论文有关的研究方向
在现代足球对运动员要求越来越高的同时,对裁判要求也相应提高,现代足球竞赛规则也赋予了裁判员更大的权利,而在现实比赛中,可能会出现很多影响裁判员判罚的因素,例如裁判员
清代画家方薰在《山静居画论》中说:“款题画始自苏(轼)、米(芾),至元明而遂多。以题语位置画境者,画亦由题益妙。高情逸思,画之不足,题以发之,后世乃为泛觞。”方薰所说的“
测序技术的进步使得蛋白质序列数据与日俱增,然而人们对蛋白质高级结构和功能的认识还不够,远远落后于对蛋白质序列的认识。同时,传统的生物实验方法已难以满足海量数据的处理需
<正>书籍编纂的历史背景一、各族文化的汇合魏晋南北朝的四个世纪在中国历史上占有特殊的地位。尖锐的阶级矛盾与错综复杂的民族矛盾相结合,在政治、经济和文化各方面产生了
会议
目的围绕设计管理的定义及方法,探讨设计管理的学科本质与一般程序,解析设计管理的脉络发展。方法通过文献研究法,梳理设计管理的学科发展脉络并聚类分析其现有定义;基于狭义
产学研结合是我国科教兴国战略的重要内容。本文结合调研数据,以交通安全与智能控制专业为例,分析了目前高职产学研结合教育现状,总结了存在的主要问题,并针对性的提出对策和
目的:针对手术室护理管理中实施质量控制小组管理模式的临床价值进行分析。方法:2012年11月-2013年11月在手术室护理中开展质量控制小组管理模式的阶段作为试验组,2012年11月