基于多标签直推学习的抗菌肽功能预测

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:shendongshendong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
抗菌肽是广泛存在于生物体内的一类具有广谱抗菌作用的天然多肽,因其不易导致细菌耐药性,现已成为医药界开发新型抗菌制剂的主要选择,因此识别出更多的抗菌肽并预测其单种或多种抗菌功能具有重要意义。在抗菌肽的识别和功能预测中,基于机器学习的方法因其高精度、低成本、高可行性及高可靠性等优点,被越来越多的应用于抗菌肽的识别和其抗菌功能的预测中,但目前已有的方法还不能同时进行抗菌肽的识别和其抗菌功能的预测,计算精度仍有提高的空间。本文研究基于机器学习的抗菌肽识别及其功能预测,内容主要有:1.提出一种基于单个优化问题的多标签分类方法,该方法不仅能够识别多肽是否为抗菌肽,还能同时预测出抗菌肽所具有的抗细菌功能、抗真菌功能、抗肿瘤细胞功能、抗病毒功能和抗HIV功能等单种或多种抗菌功能;2.针对抗菌肽功能预测问题中有标签样本较少、无标签样本较多且蕴含大量信息的特点,提出基于图的直推预测模型,通过对有标签训练样本和无标签待测样本的共同学习来提升预测性能,并且在利用直推学习方法构建近邻图时,在对各样本局部关联关系计算时对各抗菌功能类别加以了不同权重,将不同类别对预测方法的贡献度区分开来;3.为了更好的验证预测方法的泛化性,本文除了整理利用发表过的数据集外,还结合新公布的APD(Antimicrobial Peptide Database)中的抗菌肽序列以及UniProt(Universal Protein)数据库中的非抗菌肽序列构建了新的与训练集序列同源性较低的测试集来对预测方法进行实验;采用K-Spaced氨基酸对组成方法(Composition of K-Spaced Amino Acid Pairs,CKSAAP)进行多肽序列特征信息的提取。结果表明,与已有的iAMP-2L预测方法相比,本文方法在全局预测精度和多标签预测性能上均有一定提升。为了更好的开展交流,基于本文预测方法的在线预测平台也已上线,可为感兴趣的研究人员提供下载和预测服务。
其他文献
本文着重研究了共轭梯度法与非单调线搜索技术结合的算法,主要内容如下:第二章为有效求解大规模无约束优化问题,基于RMFI共轭梯度法,结合Zhang H.C.非单调线搜索步长规则,建
在化学工业中氢气(H2)是一种用途广泛的气体。氢气被认为是一种可以替代化石资源的气体,因为它应用在燃料电池中。基于半导体纳米颗粒的多相光催化吸引着商业上的兴趣。本工
量子态作为量子计算的基本概念,具有丰富和优美的数学结构和物理特性,如叠加性,纠缠性等。利用由量子态叠加性质推出的量子不可克隆性定理可以用来设计无条件安全的量子密码
如今,在光通信设备的市场中,仍旧是以国外核心技术的器件设备为主,由此,就使得国内在光通信的研发以及实际应用中消耗了大量的成本价值,也不利于光通信的迅速发展和中国关于
全光信号处理的集成化是未来通信系统发展的必然趋势。硅基混合波导具有体积小、易集成、低功耗、色散灵活可调、与CMOS工艺兼容等诸多优势,是一种很好的导光介质。其非线性
嵌段共聚物是由两个或多个不同化学性质的链段由化学键连接形成的高分子。由于嵌段共聚物能微相分离形成不同形貌的纳米结构,可应用在能源、光电、生物和催化等领域。因此,如
光子晶体光纤(photonic crystal fiber,PCF)优良的光学特性及灵活的结构设计使其成为一种优秀的光子器件材料广泛应用于光纤通信和光纤传感等领域。近些年来,随着光子晶体光
近年来,随着人们生活水平的提高,汽车逐渐成为了人们日常出行不可或缺的代步工具。然而化石能源的大量消耗使人们周围的空气环境被严重污染、破坏,甚至威胁人们的身心健康。
模分复用是光纤通信系统中一个非常有前景的研究方向,它在少模光纤中通过模式的复用和解复用可以使当前光纤通信系统的传输容量成倍提高。模式产生和模式转换技术是模分复用
最近几年,某研究小组在全同Kuramoto相振子系统中发现了一种奇异态的集体行为:在同一时刻,系统中的一部分振子处于同步态而另一部分振子处于去同步态。这种集体行为被Abrams