只利用序列信息预测蛋白质相互作用的深度神经网络模型研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:wang_hua1983
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于机器学习的蛋白质-蛋白质相互作用(PPI)预测可以为蛋白质功能、疾病发生和大规模治疗设计提供非常有价值的帮助。但是大多数基于机器学习的方法都需要做大量的特征工程,这增加了预测任务的工作量和时间成本。新兴的深度学习技术可以自动实现特征工程,在各个领域都取得了巨大的成功。然而,在大多数情况下,深度学习模型的过拟合和泛化性能尚未得到很好的研究。在本文中,我们提出了一个深度神经网络框架(DNN-PPI),它可以利用仅从蛋白质一级序列自动学习到的特征来预测PPI。在这个模型中,来自一个蛋白质对的两条蛋白质序列被分别送入编码层、嵌入层、卷积层以及长短期记忆网络,最后,把两段输出的特征向量合并成一条特征向量,并输入若干全连接层,并通过sigmoid函数完成分类,从而预测蛋白质对是否具有相互作用。本文所提出的方法不仅可以探测氨基酸残基之间的位置关系,还可以探测氨基酸之间的长短期依赖性。同时,相比起传统的机器学习方法需要人工提取序列特征,深度学习模型可以自动地提取更加抽象的特征,也有利于获得更好的预测效果。最终,当该方法运用于Pan的人类蛋白质互作数据集上时,预测准确率为0.988,马修斯相关系数为0.976。在预测六个外部数据集时,准确率从0.928到0.979不等。这些实验结果表明,本研究所提出的方法在预测蛋白质相互作用方面有着明显优势。
其他文献
白桦脂酸是一种羽扇烷型五环三萜,具有诸多药理活性如抗肿瘤、抗病毒和抗疟疾等,特别在抗人黑色素瘤和抗HIV方面有突出作用。目前白桦脂酸获取方法有植物提取法、半化学合成
本实验在课题组前期研究Ar-H2-H2O混合气氛对铁碳合金薄带的脱碳取得了良好成果的基础上,开展在更弱氧化性Ar-CO-CO2气氛下对铁碳合金薄带的脱碳研究。以初始碳含量为4.15、3
海水声速在海洋中有着广泛且重要的应用,在一定程度上声速之于海洋恰如光速之于大气,海水声速是认识海洋的重要物理参数。目前基于传统直接法的海水声速测量精度一般处于数cm
分子印迹技术(MIT)是指制备对某一特定目标分子(模板分子/印迹分子)具有特异选择性的聚合物,即分子印迹聚合物(MIPs)。由于分子印迹聚合物具有构效预定性,而且对目标分子具有特异的
白血病属于恶性肿瘤,给患者与社会都带来巨大的负担,对于白血病的诊断及其相关的微小残留病监测具有重要的研究价值。现今研究结果表明,融合基因BCR-ABL及其对应融合蛋白与慢
铅基卤化物钙钛矿由于较高吸收系数、低缺陷态密度、长激子扩散长度等特点引起了人们的广泛关注。形态工程对于调整钙钛矿纳米晶体的光电性质至关重要。虽然许多一维、二维和三维的钙钛矿纳米晶已经被制备出来,但发展更多制备方法、获得更多形貌的卤化物钙钛矿仍是当前的研究热点。本文致力于将自组装方法用于制备不同形貌的CH_3NH_3PbBr_3钙钛矿,具体研究内容如下:发展了一种以钙钛矿纳米晶为起始材料、通过去润湿
生态系统服务将人类社会需求与各类自然生态系统在相互作用过程中联系起来,分析生态系统服务的时空特征,研究其权衡与协同关系对城市群区域的生态平衡调节和可持续发展具有重要的现实意义。本研究选取成都城市群作为研究区域,采用In VEST模型,并结合Arc GIS软件的空间分析、空间统计和空间制图工具,定量评估了近10年(2005-2015年)成都城市群的食物供给、水源涵养、碳储存和土壤保持4类生态系统服务
为满足电子市场对陶瓷电容器小型化、集成化的应用需求,多层陶瓷电容器(简称MLCC)在保持原有储能能力的前提下,逐步向尺寸更小、可应用温度范围更宽的方向发展,这就要求应用
微型化、集成化和智能化,是化学分析设备发展的一个重要趋势。随着微流控技术的发展,微流控芯片的广泛使用使得这一趋势得到了很好地实现。反应物之间的混合是启动相关反应的必经过程。在微流控芯片内,由于微流体的特殊性质,溶液之间的混合往往需要借助微混合器来完成。针对不同的应用领域,微混合器的混合时间有所区别。应用于蛋白质折叠、酶反应动力学等研究的超快微混合器需要在微秒级时间尺度内完成对溶液的混合,从而观察到
正压潮流流经粗糙的海底地形,以内波的形式转化成斜压潮,一部分斜压潮能以内波的形式辐射出去,剩余部分在内波生成点发生耗散,从而产生增强的湍流混合,称之为潮混合。潮混合