基于深度学习的冷冻电镜蛋白质颗粒自动挑选算法

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:benlums
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在结构生物学领域,采用单颗粒冷冻电镜技术来解析蛋白质的三维结构已经变得非常热门。在整个流程当中,蛋白质颗粒挑选过程需要耗费大量的精力与时间。目前颗粒挑选都是先人工标注一些正样本颗粒,再采用半自动颗粒挑选的方式来挑选颗粒,之后通过人工剔除其中一些假阳性颗粒例如冰渣和碳膜。因此急切需要一种全新的自动化蛋白质颗粒挑选算法来减少人的参与,同时能够剔除掉一些显著的假阳性颗粒,保证挑选颗粒的准确度。本文在此背景下通过计算机图像处理的方法设计实现了一个全自动化蛋白质颗粒挑选算法DeepPicker。在方法设计上采用迁移学习的思想,将之前已经解出来的大量现成的不同种类的蛋白质颗粒进行混合训练卷积神经网络分类器,因此这个过程中不需要人工的标注训练正负样本。其次DeepPicker采用了Canny边缘检测和单连通域分析来剔除假阳性颗粒冰渣和碳膜,极大的降低了人为的参与,实现了整个挑选流程的全自动化。最后在3个公开数据集上的测试结果表明了DeepPicker能够达到非常高的准确度,获得人工级别的蛋白质颗粒挑选结果。
其他文献
随着知识经济的快速发展,各行各业的人们对领域知识需求不断增强,人们获取知识的程度显然影响了自身发展以及在行业中发展的质量和速度。知识提取手段能够帮助人们从大量非结
谷胱甘肽(GSH)是一种由三个氨基酸组成的小分子多肽,是生物体内重要的抗氧化剂和自由基清除剂。谷胱甘肽通过与自由基或重金属结合,将机体内的有害物质转化为无害物质,从而起
云南保山西邑铅锌矿床位于保山地块中北部,是近年来发现的一个大型铅锌银多金属矿床,同时也是铅锌隐伏矿找矿取得重大突破的典型矿床。本文在野外地质调查和室内显微镜观察的
随着我国城市规模的扩大,机动车数量增长迅速,交通拥堵、道路阻塞、交通事故等诸多问题突出,大力发展公共交通是缓解城市交通问题的有效途径。公交网络设计是构建城市公交网络的基础,论文在总结已有研究的基础上,从公交大数据的处理分析入手,考虑城市公交网络中不确定性,研究在公交阻抗不确定的情形下公交网络优化模型的构建以及相应求解算法。首先论文介绍了公交大数据的基本类型和各类数据的基本结构,给出了不同公交大数据
蛋鸡养殖行业中,集约化养殖、高效率养殖等原因以及蛋鸡成长所需环境的温度、湿度等因素,往往使得养殖场大环境中致病细菌繁多,导致蛋鸡易染细菌。另外养殖场蛋鸡一生产蛋频繁、产蛋周期长,中老年蛋鸡常常患有输卵管炎、腹膜炎等炎症,使得产蛋效率低下,产蛋品质不佳。在当今限制、禁止抗生素的大势下,养殖行业为解决以上问题的最佳出路为选择植物提取物来预防与治疗疾病、促进生长与生产、减少病死率,此法不仅保证了经济利益
随着Web技术的发展,大量数据也随之产生,面对海量数据的存储和分析等相关问题,云存储、云计算、大数据分析和数据挖掘等相关概念也被相应提出。目前来说,在大数据背景下,Apac
立体视频的应用场景随着互联网的发展而越来越丰富,但是其庞大的数据量和数据压缩编码方式对传输网络构成不小的挑战。一旦在网络传输中造成误码或者数据包丢失,将对用户接收
陆地表面是一个非常复杂的系统,是连接大气圈、水圈以及生物圈的重要途径。陆面过程是地球物质能量交换过程中必不可少的环节,陆面模式模拟能力的优劣直接影响到气候模拟与预测的准确度。近年来,不同试验基地陆续开展陆面过程研究,获取了大量的观测资料,做出了大量的基础观测分析和参数化方案的研究,这极大地促进了陆面模式的形成和发展。虽然目前陆面模式的研究越来越深入,但不同陆面模式在不同地区的模拟能力有所不同。因此
冷冻电镜技术是结构生物学领域一项重要的技术,近几年由于它能够获得近原子分辨率的生物大分子结构,开始被大力发展,其中由于单颗粒分析技术理论上能达到原子分辨率,得到了许
灭火作业预案模拟(FFOS/SM)系统是面向高危害性事故的灭火作业特别是化学爆炸类灭火作业的具体需求所研发的应用软件,本文应用软件工程方法和技术从功能需求、软件设计和程序