基于深度学习的蛋白质亚细胞定位预测算法研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:zyqtc1989
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在细胞生物学的研究中,高内涵图像被用于细胞的基因遗传分析和由环境变化引起的基因突变分析。高内涵图像技术的出现,让生物学家有能力设计出研究不同基因突变间的关系和细胞生长周期形态的实验。虽然高内涵图像分析的实验方法给我们带来了很多的好处,但是处理大规模的高内涵图像数据对于我们来说仍然是一种挑战。高内涵图像包含非常丰富的信息和特征,如何提取出我们想要的信息是其中一个难题,比如蛋白质亚细胞定位。有一些研究团队仍然在用人眼识别高内涵图像中细胞的蛋白质亚细胞定位,也有一些团队开发出了基于传统机器学习的蛋白质亚细胞定位预测的算法。本文基于卷积神经网络的深度学习算法,提出一种对高内涵图片做蛋白质亚细胞定位预测的计算方法。本文设计了一个卷积神经网络模型,测试的时候用荧光蛋白标记过的酵母菌细胞作为数据集,在总共15类的分类标签任务下,展示了卷积神经网络方法和传统机器学习方法在相同数据集相同任务下的分类性能,并从特征分布,特征可视化和迁移学习的角度分析了卷积神经网络模型为什么能够获得这个性能。本文证明了在这个数据集的15类分类任务下,卷积神经网络模型能提取出图片的高维特征,分类性能要优于传统机器学习算法。然后进一步证明了该网络可以用来做不同的分类任务,包括相同实验的数据集不同分类标签和不同实验的数据集。最终用这个网络去分析酵母菌细胞在交配信息素的作用下,蛋白质在亚细胞定位上的变化,实验总共涵盖了200多种蛋白质。
其他文献
环保部副部长吴晓青在“第二届世界低碳与生态经济大会高峰论坛”上透露,目前,我国环保产业从业单位有3万多家,从业人员近300万人。“十二五”我国将积极培育和发展环保产业,大力
金代的户口普查制度设计非常严密,在户口登记的范围、对象,申报、调查统计程序和期限等方面都有严格的规定,保证了统计结果的准确性。金代严格的户籍管理制度和户口统计程序
文章主要从社会体育专业校外实践基地建设必要性、实践教学现状、基地建设面临的困境、有效建设途径四方面探讨如何建设社会体育专业校外实践教学基地.
目的观察遵医行为对中央性前置胎盘妊娠结局的影响。方法回顾性分析我院2007年1月~2009年12月58例中央性前置胎盘患者的临床资料。设有良好遵医行为第一次住院至分娩的患者28
利用PCR简并引物扩增出HSP60基因中一段约600bp的核心片段,将该核心片段标记为探针.与基因组DNA进行Southern杂交,选择出适宜的限制性内切酶,以便消化基因组DNA得到大小合适
介绍张天文教授治疗泄泻的临床经验,张教授根据《皇帝内经》有关泄泻的理论,将泄泻病因主要分为外感与内伤,外感泄泻当以湿邪最为重要,而湿邪又有寒湿与湿热之分,脾恶湿,外来
基础英语与行业英语相结合是高职高专英语教学改革的一项重要内容,多媒体辅助教学是实现基础英语与行业英语结合必不可少的教学手段。在高职高专基础英语和行业英语相结合过
目的观察血友病A(HA)及获得性HA(AHA)患者凝血因子Ⅷ(FⅧ)抑制物的产生情况,探讨Nijmegen法结合APTT纠正试验在FⅧ抑制物检测中的应用及对临床诊断和治疗的指导意义。方法用一期凝
分离鉴定了PaP3噬菌体57kD蛋白的编码基因并对其功能进行了初步探讨。用PEG沉淀结合CsCl梯度密度离心分离、纯化噬菌体颗粒,通过SDS-PAGE分析该噬菌体的衣壳蛋白,转印PVDF膜后,