【摘 要】
:
人类基因组计划自上世纪末正式启动后,通过科学家们前赴后继的攻克难关,终在本世纪初完成了人类基因图谱绘制,自此又称为后基因组时代,而蛋白质组研究就是后基因组时代生命科
论文部分内容阅读
人类基因组计划自上世纪末正式启动后,通过科学家们前赴后继的攻克难关,终在本世纪初完成了人类基因图谱绘制,自此又称为后基因组时代,而蛋白质组研究就是后基因组时代生命科学中最重大的研究课题之一。想要研究蛋白质组,首要的任务就是研究其功能与结构。而科学界普遍的认知是蛋白质二级结构的预测是其整体结构预测的先驱,是首要的。它的原理就是通过对其中部分结构序列中的氨基酸进行类别划分,最终得到我们所需要的结果。因此,有一个准确率高的蛋白质二级结构预测方法能够对后续的研究有着一个承上启下的重要作用。蛋白质二级结构的预测方法自上世纪中期开始被研究提出,至今已有许多行之有效的方法,而本文所使用的方法则是使用隐马尔可夫模型(Hidden Markov Model,HMM)去预测。HMM是来解释一个有隐含且是未知参数的马尔可夫过程,它的状态是无法被直观观测得到的,但能够通过分析检测向量的序列从而得到结果。本次使用的数据集是典型的蛋白质数据集,CB513数据集。对其进行处理,除去其中一些不具有一般性的蛋白质序列,剩下492条蛋白质序列。将这些序列进行随机分组,选取其中420条蛋白质序列作为我们测试序列,将其随机分配成10组实验组,每组共42个蛋白质序列,又将其随机分成7等份,每等份有6条蛋白质序列,使用提高准确率的7-交叉验证的方法,即将6等份中的6等份作为训练集,剩下的一份作为测试集,相互测试共进行6次实验,然后一共有10组大实验组,即进行70次实验。而对于使用的HMM的模型,将单残基概率作为主要参数进行实验。得到最终的整体准确率达到了 58%以上。当然这种方法还可以改善,希望在以后的学习中可以进一步优化算法,使得准确率得到进一步的提高。
其他文献
分支预测技术可消除分支指令之后损失的周期,防止流水线断流.高比率的分支预测精确度是高性能微处理器性能的保证.本文详细分析了安腾处理器(Itanium)多级分支预测机制,并研
为了提高输出输入信噪比增益,本文通过增加并联静态系统的数目研究了并联静态系统的输出输人信噪比增益问题,推导了并联静态系统输出输入信噪比增益的理论公式。研究结果表明,信
目的对在我院接受恶性肿瘤化疗治疗的60例患者,进行化疗护理疗效的分析。方法选取2008年9月至2009年9月在我院接受恶性肿瘤化疗治疗的患者60例,根据患者所接受的不同恶性肿瘤
本文运用维果茨基的“最近发展区”理论和巴班斯基的“教学最优化”理论深刻分析了高校大合班的现状、特点及存在的主要问题,尝试提出了改进高校大合班教学质量、提高课堂有效
目的:分析门诊患儿输液治疗的心理护理干预效果。方法:对门诊不同年龄组患儿在静脉输液前针对性进行分散注意力、诱导意向、暗示疗法、音乐疗法等心理干预。结果:不合作的年
1药源性疾病(DID)1.1DID定义任何药物都有两重性,既可防治疾病,又会给患者造成不良反应,甚至引起死亡。随着新药特别是化学药物不断增多,由于临床经验不足,对其毒副作用和不良
目的:探讨经皮撬拨复位克氏针固定术与切开复位钢板内固定术治疗跟骨骨折的临床效果。方法:随机选取本院2014年3月~2016年3月收治的86例跟骨骨折患者,采用抽签法将患者分成Ⅰ
分析了在传统的概率与数理统计合班课堂教学中存在的一些问题;然后分析了使用“雨课堂”教学的特点,它填补了传统课堂教学的不足,实现课堂教学与在线教学的有机结合,促进了学
中医在治疗疾病方面发挥着重要作用,以往中医治疗疾病过程中多采用传统中药煎剂。随着中药有效成分提取技术、中药生产加工技术的发展,中药免煎剂在临床得到广泛应用。中药免
笔者2008年8月受中国国际航空股份有限公司委派到合肥任营业部总经理,负责国航在安徽航空市场的营销工作。在传统市场营销组合(4P组合)的基础上,灵活运用公共关系营销手段,借