基于深度学习的蛋白质二级结构预测

来源 :广西大学 | 被引量 : 0次 | 上传用户:deqiangranran
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质的结构是其发挥生物学功能的基础,认识蛋白质的结构与功能的关系对于生物学、医学和药学都具有非常重要的意义。然而目前已知蛋白质结构数量远小于已知序列数量,并且由于结构测定的复杂性这个差距将会进一步加剧,所以从理论上通过蛋白质序列预测其结构得到了广泛的关注。作为序列与三级结构间的桥梁,得出一个有效的蛋白质二级结构预测方法是研究蛋白质结构及其功能的有效手段和基础。通过对现有研究的深度梳理,本文综合序列信息表示和预测模型的研究,给出蛋白质二级结构预测的深度学习新方案。在此基础上,尝试通过利用分类间联系进一步提升了预测效果。主要研究内容及成果可概括为:首先提出一个新颖的深度学习模型MSTCNPP,该模型使用时间卷积网络同时捕捉序列中的短程依赖和长程信息,并借助注意力机制更精准地捕捉蛋白质序列中残基间的相互影响。在以PSSM和正交编码为特征输入时,能够正确预测CB513数据集中70.47%的残基所处二级结构状态。并且全卷积架构极大地提高了网络的并行性;得出以上模型后,进一步探究了特征表示问题。充分考虑二级结构形成过程中可能存在的影响因素后,独创地构造了2组新特征,研究了更综合有效的特征表示方法。在加入理化性质和对数相对概率特征后,MSTCNPP的预测正确率达到70.60%;此外,尝试将三分类与八分类之间的联系作为重要规则和约束以进一步提升二级结构预测效果。通过实验分析,利用了3-8联系的多输出同时预测方法MOSP能够给出更合理的预测结果,对四个数据集上的Q3和Q8分别产生了0.73%和0.48%的平均增益。将以上三个部分的研究成果综合在一起,在单个模型中实现了70.74%的Q8准确率,以及83.68%的Q3准确率,达到先进水平。并且各部分的方法可以轻松地移植到其他模型方法之中,具有较强的可行性和实用性。
其他文献
随着物联网时代的到来,大量传感器需要被布设到日常生活中,用以监测环境中的参数。而纳米发电机作为新兴的能量采集方式,逐渐被应用到各个方面。本文将纳米发电机和传感器集成到一起,提出了一种基于高效率纳米发电机的自供电智能传感系统。其中纳米发电机作为电源为传感器供电,传感器采集环境中的参数进行监测。论文的主要研究内容安排如下:首先,本文对高效率纳米发电机的结构模型和工作机制进行了详细地介绍,其创新点在于创
随着信息技术的快速发展,目前许多医院已经具备了较为完善的医疗信息化平台和HIS、LIS和PACS等业务系统,对患者临床资料,实验室检查结果以及医学影像等医疗数据有了较为系统化的电子保存,积累了丰富的数据资源。但是这些数据分散保存在各个不同医疗机构的不同业务系统,医生在书写影像诊断报告时,并不能调阅分别保存在HIS和LIS系统中的患者临床资料和实验室检查结果,影响诊断准确性。特别是在分级诊疗背景下,
随着中国制造2025的推进,能够与人协同工作的协作机器人发展迅猛。然而,针对协作机器人末端夹具的研究却相对较少。一方面,对于机械本体的研究热点偏向更具挑战性的仿人灵巧手,缺少工业用途的末端夹具的研究;另一方面,对于抓取规划的研究更多侧重于机械臂的运动规划方面,而较少有针对末端夹具的抓取策略的研究。本文设计了一款新型欠驱动灵巧抓手,并针对其抓取特点提出抓取规划。主要工作及创新点如下:(1)提出一种全
随着近代科技和工业的发展,人们的生活水平不断提高,但是能源短缺和环境污染两个问题变接踵而来,如此情势下,人们开始着手于环境治理以及新能源的研发。在大量的探索研究中发
本文以铜、氟喹诺酮类抗生素(诺氟沙星、环丙沙星)为试验材料,黑麦草为受试生物,采用水培试验法,通过测定黑麦草种子发芽(发芽率、发芽势)、丙二醛(MDA)含量、超氧化物歧化酶(SOD)活性、叶绿素含量和脯氨酸(Pro)含量,探究铜、氟喹诺酮类抗生素(诺氟沙星、环丙沙星)单一毒性及联合毒性对黑麦草的生物毒性效应。试验结果如下:1)诺氟沙星、环丙沙星对黑麦草种子发芽均具有抑制作用,而铜对黑麦草种子萌发具
除草剂的大量使用造成严重的环境问题,快速检测水环境中残留除草剂的生物毒性对评价除草剂环境效能有重要意义。藻叶绿素荧光对除草剂有灵敏响应,为建立完善藻荧光快速、灵敏检测除草剂生物毒性方法,本实验研究了在硫酸铵助剂环境下藻类荧光对除草剂(均三嗪除草剂)生物毒性响应规律。实验选取了蛋白核小球藻、斜生栅藻两种敏感藻种为指示藻,以光合作用抑制剂均三嗪除草剂莠去津和莠灭净为测试除草剂,以叶绿素荧光参数最大光合
随着无人飞行器、机器人、自动驾驶、室内测量等行业蓬勃发展,同步定位与建图技术(SLAM,Simultaneous Localization And Mapping)得到了众多研究者们的广泛关注,成为计算机视觉领域的研究热点。该技术可实时处理传感器采集的数据,如影像、激光点云等,得到传感器的位置、姿态以及场景的地图信息,为机器人、车辆等提供定位和导航的基础数据。基于视觉的同步定位与建图技术(vSLA
写作是写作主体在对自然、社会、人生有比较深入的观察和思考之后用书面语言进行的有针对性表达的活动。写作能力是一个有文化人的必备能力。初中是人一生发展的奠基阶段,初
木素是自然界中最丰富的天然芳香族高分子聚合物以及可再生化学品生产的重要原料,由苯基丙烷结构单元通过醚键和碳-碳键连接构成,具有三度空间结构。工业木素主要来源于制浆造纸工业或生物质精炼过程中产生的副产物,产量丰富,成本低廉。遗憾的是,制浆造纸工业中木素只有极少部分被用于生产化学品,绝大部分则作为低价值燃料燃烧,造成资源的浪费和环境的污染。本文以绵竹硫酸盐木素为原料,以制备得到的固定化漆酶、固定化Co
金属有机框架(MOFs),是一类结构新颖、性能优异的微孔晶态材料。与传统无机多孔材料相比,具有合成条件温和、结构明确和功能可设计性等优势。近年来,各种各样的MOFs结构被设计