用支持向量机和离散增量方法预测人类血液分泌蛋白质

来源 :内蒙古大学 | 被引量 : 0次 | 上传用户:chendegeng1234
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
分泌蛋白质(secretory protein)是合成在细胞内的蛋白质,通过各种分泌途径分泌到细胞外,在生物体中,蛋白质的分泌发生是一种普遍的生物过程,蛋白质的分泌是生物体保证基本生命活动的重要方式。分泌蛋白质中的一类——人类血液分泌蛋白质是与癌症、肿瘤等人类重大疾病相关的,可以用它们来判断癌症类型及疾病恶化阶段,并用于新药物的开发。因此,在生物信息学研究领域,采用有效的方法来确定和预测人类血液分泌蛋白质是至关重要的。由于人类血液中蛋白质组成的复杂性和蛋白质运动范围的广泛性,识别人类血液分泌蛋白质非常具有挑战性。本论文以人类血液分泌蛋白质作为研究对象,采用不同的预测方法,分别对人类血液分泌蛋白质进行了预测研究。论文的主要研究工作如下:1.随着蛋白质数据库的不断更新,构建了新的人类血液分泌蛋白质数据集,扩大了人类血液分泌蛋白质的序列条数。2.利用支持向量机(SVM)、离散增量(ID)和离散增量结合支持向量机(ID_SVM)方法,分别对人类血液分泌蛋白质进行预测,均取得了较好的预测效果。3.提取了一种新的蛋白质序列特征信息——平均化学位移信息,并与其它蛋白质序列信息组合,分别作为SVM、ID和ID_SVM算法的特征向量,对人类血液分泌蛋白质进行了预测研究。结果表明,结合平均化学位移信息后,预测成功率明显提高,在Jack-knife检验下,比单纯考虑氨基酸单肽信息提高了15个百分点。
其他文献
近年来传感器技术和无线通信技术得到快速发展,无线传感器网络作为一种全新的信息获取及处理技术应用在众多领域。无线传感器网络的应用无不依赖于节点的位置信息,而移动节点定
针对制药厂提出的药盒夹持要求,提出一种新型欠驱动机械手的设计方案。该方案机械手采用气压驱动,并巧妙利用变自由度理论与机构死点理论,利用单个动力源实现对药盒的可靠夹
基因表达受各种综合因素的调控,它是一个高度复杂的过程.在生物的发育和生长过程中,基因在拥有相同DNA序列的状态下,表达水平却完全不同.生物的遗传信息不是仅由DNA决定的,而是与
玻色-爱因斯坦凝聚,作为一种新颖的物质形态,是物理学的前沿研究热点之一。特别是近年来,科学家先后实现了分子的玻色-爱因斯坦凝聚体(Bose-Einstein condensates,BECs)、费米凝
压力是物质独立于温度和化学组成成分的一个重要维度,高压行为能够改变物质内部原子和分子间的相互作用,并诱导新结构与新物质的产生,为得到新材料提供了创新性源泉。碱土金属材
基因组表达调控是一个非常复杂的过程,除了DNA自身序列的调控作用外,还受到很多表观遗传修饰的调控作用。近年来,人们逐渐发现表观遗传学的重要性及其在医学领域上的应用。组蛋
本文讨论纤锌矿AlxGa1-xN异质结构中界面光学声子散射和界面粗糙度散射对电子气分布的影响.  首先,讨论纤锌矿A1N/AlxGa1-xN/AlN量子阱中界面光学声子对电子迁移率的影响. 
全面建设小康社会,“三农”问题是最大的难点和重点。如何推进农业产业化,提高农民的组织化程度,从而探索解决“三农”问题的新途径,带着这些问题,我和市里有关部门的同志,
量子点发光二极管(Quantum-dot Light-emitting Diodes, QLED),具有光谱覆盖范围宽、色纯度高、能耗低等优势,在智能手机、大尺寸超清显示屏和高端照明等领域有着广阔应用前景,
2003年Kalinowski et al.发现对无磁性有机材料施加磁场后通过器件的电流会发生显著的变化。自此以后,有机磁效应(OMFE)在实验上和理论上得到了广泛的研究。在实验上,人们发现