预测蛋白质二级结构的半监督对抗生成网络模型研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:xingzhe009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着高通量测序技术的发展,只利用序列信息预测蛋白质二级结构成为计算生物学研究的热点问题之一。当前的机器学习方法使用大量的标注样本,通过构建监督学习模型实现二级结构的预测。然而获得二级结构的标注信息往往需要大量的生物学实验和人工纠正,是一项耗时且代价昂贵的任务。本文提出只利用较少标注样本来预测蛋白质二级结构的半监督对抗生成网络模型,主要贡献包括:(1)首先,对实验所用到的数据集进行数据清洗,对数据集的蛋白质一级结构进行特征提取,将一级结构的位置特异性评分矩阵作为本研究的数据特征。紧接着为了在训练过程中满足半监督学习的条件。为训练集设置一个向量(label_masked),其目的是为了遮挡有标签的氨基酸的二级结构类型的标签,从而达到半监督学习进行训练的目的。(2)其次,本研究提出一种利用较少标注样本来预测蛋白质二级结构的半监督对抗生成网络深度学习模型。该模型是基于生成对抗网络的思想进行搭建的。模型的训练数据利用大量无标签的数据进行半监督学习训练,避免了传统监督学习预测蛋白质二级结构需要进行繁琐标注的问题繁琐的工作。(3)最后,对模型进行训练调参,最终模型对于CullPDB6133的测试集数据在有缺失数据的训练后分别达到~70.2%的Q8预测精度和~81.8%的Q3预测精度。在独立数据集CB513上获得的Q8和Q3预测精度分别达到~66.2和79.8%。
其他文献
扭矩是工业生产和机械传动中重要的载荷形式,在船舶、航天、工农业等领域都有重要应用。本文主要介绍了基于磁弹式传感器传感机理及研究动态,使用磁致伸缩性能良好的坡莫合金薄带作为磁敏材料与非磁性轴结合,实现非铁磁性轴的扭矩测量。提出基于平面柔性线圈涡流耦合的扭矩测量方案,该测量方案不同于传统互感线圈(励磁—感应)电压表征扭矩的方法,而是采用平面线圈的电感量表征扭矩,通过线圈与涡流的耦合传感磁导率的变化,为
作为RNA甲基化最丰富修饰物之一,N6-甲基腺苷(N6-methyladenosine,m6A)的甲基化作用实际上涉及到许多生物过程,包括大脑发育畸形、人体肥胖、蛋白质翻译、RNA剪接、RNA降解和RNA稳定性。目前研究表明,采用高通量测序或者湿实验的方式可以检测m6A峰值的情况。然而该方式不能够准确定位m6A甲基化位点。而随着人工智能时代的来临,人们开始探寻使用机器学习的方式识别m6A甲基化位点
由于现在的图像质量越来越高,现有的图像压缩技术已经不能满足目前的需求。于是使用卷积神经网络解决图像压缩成为目前热门的研究领域。但是,通过卷积神经网络训练学习后得到的网络模型不管在存储还是计算上都耗费了庞大的计算机资源。如何解决这个问题成为工业界和学术界研究的重点。本文提出一种深度卷积生成式对抗网络结构,该网络模型由卷积网络构成,可以带来比现有技术更加好的压缩效果,但是复杂的网络模型与巨大的计算量带
无常的天气、深邃的海底让人对奇妙的海底世界敬而远之。是凡尔纳让那无尽的深海变得诱人起来,海底世界的一切都有存在的价值和意义:这里有你从未见过的大叶藻铺成的床,各色奇特的海中珍品,潜艇甚至可以利用海底开采的煤的热量提取氯化钠,与汞混合成汞合金发电……阿龙纳斯教授是整个海底航行的见证者,作者以他的视角向读者展开这段奇妙的旅行,本期就让我们一起和阿龙纳斯一起畅游海底两万里吧!
期刊
人脸表情识别指通过计算机来计算和分析人的脸部肌肉、形态和关键特征的变化,从而判断其内部情绪。在模式识别领域中,人脸表情识别是一个非常活跃和具有挑战性的领域,广泛应用于人机交互环境的智能化、远程教育和精神病理分析等。然而,尽管最近的研究中,深度学习和卷积神经网络已经成功应用于人脸表情识别,但是无约束情况下的部分遮挡人脸表情识别仍然是一个挑战,并已经成为其在实际生活应用中的一大阻碍。一方面,人脸表情识
大脑是个复杂且神奇的组织系统,它可以对接收到的外界信息进行加工处理,并促使人类完成相应的认知过程。探索大脑的组织结构和执行功能之间的关系是理解人类的思维过程以及脑类疾病的关键所在。近年来,将图论引入脑功能的研究即将大脑抽象为一个复杂网络,能形象地揭示脑功能网络中信息传递过程。此外,社团结构是刻画复杂网络结构特性与网络内在潜在关系的基本特性之一,因此通过社团检测去分析各脑区之间的关系对理解大脑的组织
翻开这本写于150年前的小说,我们很难感觉到时间的流逝:仿佛这些发生在海底的故事刚刚创作完成,作家笔尖上的墨水还没有彻底干透。旅行是儒勒·凡尔纳一生写作的主题。不过,他笔下的旅行并不限于在已知世界的版图上巡游。科幻小说给了他更为广阔的舞台。他可以凭借想象,抵达彼时人类从未企及的领域。换句话说,他的写作就是挑战未知,用想象填补真实世界的缺失,将所有的不可能变成可能。因此,哪怕驱使他创作的是天马
期刊
无向概率图模型之马尔科夫随机场(Markov Random Field,MRF)是一种能够有效对真实世界中的网络结构进行建模的工具。MRF最近已被成功地应用于社团发现领域,并取得了很好的效果。然而已有基于MRF的社团发现方法大多仅利用了网络中的拓扑结构进行社团发现,而在网络中具有同样重要地位的属性信息却被忽视了。为了解决该问题,本文将善于描述属性语义的主题模型融入擅长刻画网络拓扑的MRF社团发现模
深度学习的形式化理解一直是一个重要的研究主题。近年来,借助量子多体物理学,深度学习的形式化理解已经取得了很大的进展。例如,在量子多体系统中,通过量子纠缠熵,神经网络中的归纳偏置可以被解释,此外还可以借助量子纠缠与神经网络之间的关系指导某些任务的网络架构和参数的设计。然而,在最近的关于量子纠缠研究中,还存在两个仍未揭示的问题,这些问题限制了纠缠测量的应用潜力。首先,纠缠熵的理论分析仅在单个对象(比如
近年来,机器学习与其他领域的结合越来越紧密,如出行领域、娱乐领域等。与此同时,将机器学习应用于生物领域也逐渐被研究者关注,先前有文章将细胞、组织等生物的研究与机器学习结合起来,来识别细胞的特征,但这些模型相比于其他领域较为落后和粗糙,而且这些研究都是基于监督学习的方式来识别细胞特征,很少有学者利用机器学习来研究细胞的迁移规律。在胚胎发育的早期阶段,细胞受到一套高度复杂的多尺度调控机制的影响,因而对