基于字符串核的MHC Ⅱ类分子亲和肽预测研究

来源 :复旦大学 | 被引量 : 0次 | 上传用户:jql
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
主要组织相容性复合物(Major Histocompatibility Complex,MHC)主要参与抗原的呈递,MHC分子与抗原短肽的结合是免疫系统产生免疫反应中必不可少的一个环节。因此MHC分子亲和肽的精确预测有着重要的实际意义,可以让人们更好的理解免疫应答机制,也可指导表位疫苗的设计和研制。计算机辅助预测在该领域的应用很大程度上减少了在预测问题上的财力和人力投入,并且相比传统的实验测定方法缩短了预测时间。  MHCⅡ类分子呈现高度多态性,并且其亲和肽的长度并不固定,这大大增加了MHCⅡ类分子多肽绑定预测的难度,针对MHCⅡ类分子亲和肽预测我们提出了基于两个不同策略的方法。第一种是基于集成学习策略AvgTanh我们提出了MetaMHCⅡpan集成分类器,该方法使用多个不相同的跨亚型分类器作为基础分类器,在预测结果上相比单个分类器在整体预测准确度上有着一定的性能提升。第二种方法中,考虑MHCⅡ类分子多肽绑定的特异性,我们提出了计算不同长度多肽相似度的方法MHC2SK(MHCⅡ String Kernel),相比先前提出的相似度度量方法SRBF和GS有更好的表现性能。我们进一步将MHC2SK扩展为MHC2SKpan,通过共享分子间的绑定信息,MHC2SKpan能够为任何有已知蛋白序列的MHCⅡ类DR分子提供多肽绑定预测。为探讨MHC2SKpan的预测性能,我们在不同的基准数据集上与其他跨亚型预测方法做了详细对比,从实验结果可以看到MHC2SKpan好于其他预测分类器,是目前预测性能最好的方法。
其他文献
在计算机和互联网技术的高速发展的今天,信息的发布与共享不再受到时空限制,同时也给我们带来了“信息过载”的问题,即信息资源极大丰富,而真正有用的信息和知识却相对匮乏。作为
随着现代软件工程的飞速增长,对软件产品的能否具备竞争力来说无疑是一种挑战。与此同时,如何有效的确定软件项目的截止日期以及如何控制项目的成本,已成为越来越受重视的研究问
基于策略的IPSec密钥协商在Internet环境下应当解决如何描述安全策略、如何解决不同实体之间的安全策略冲突以及用户的鉴定和授权等问题。但是现有的IPSec策略管理机制仅仅解
本文对基于LDAP和Web服务的校园统一身份认证系统的实现进行了研究。文章在分析校园网的安全特性和身份认证现状、综合各相关技术特征的基础上,根据学校校园网应用服务多、地
当前对员工进行有效培训已经越来越成为一种重要的经营活动,它是保持企业发展动力和竞争优势的重要手段。在所有的知识技能培训中,销售技能的培训对于所有企业来说都是至关重
本文描述了Discovery - 一个并行分布式事件驱动数模混合VLSI系统的仿真框架。Discovery是一个开放的系统,它不仅使用并行和分布式处理来加速仿真,也允许集成各种各样的顺序仿真
最优化问题包括连续优化问题和离散优化问题,对于连续优化问题中的多模函数问题和离散优化问题中的非确定多项式(Non-Deterministic Polynomial,NP)难问题,智能算法求解这些问
各种工件在加工后内部经常会存在着不同程度的残余应力,残余应力导致了工件的变形与破裂。振动时效是一种有效的消除工件内残余应力的方法,它具有明显的优点:节省能源、污染小、
“点目标”这一概念首先来源于军事领域。在夜视环境下,空间作战的敌方目标一般都处于远距离的复杂云天背景之下,通过传感器采样得到的图像中,目标往往成像面积都在几个像素,甚至
本文对并行逻辑模拟中容错技术进行了研究。文章介绍了并行逻辑模拟的原理、系统组成和影响模拟性能的因素,论述了和容错密切相关的时间偏差协议。在对并行逻辑模拟系统的特殊