基于多层神经网络的用于三级结构预测的RNA打分函数

来源 :南京大学 | 被引量 : 0次 | 上传用户:yluylu2k
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
核糖核酸(RNA)是生物体内重要的基本物质。在编码、解码、调节和表达基因中起重要的作用。RNA的功能主要取决于其三维空间结构,而通过X射线衍射和核磁共振等实验方法获取RNA的三维结构,不仅实验成本高,且存在技术上的很大挑战。这使得通过计算的方法来预测RNA的三级结构变得非常必要。RNA三级结构的从头预测需要一个好的打分函数。在这项研究中,我们基于机器学习的方法发展了一个新的打分函数。人工神经网络作为机器学习的重要分支,在近几年发展迅速。我们希望可以用神经网络这个具有潜力的工具来解决结构预测中遇到的难题。与传统的打分函数相比,该方法在引入不同特征时更加灵活,也不用面对选择参考态的难题。我们构建并训练了两个多层神经网络。它们以候选RNA的结构和序列特性作为输入,然后输出其相似性分数,评估候选RNA与天然结构的相似性。第一个网络使用粗粒化的RNA结构作为输入,第二个网络则使用全原子信息。我们还构建了一个RNA数据库,并将其分为训练、验证和测试集,分别包含322、70和70个RNA。每个RNA伴有300个由高温分子动力学模拟产生的decoy。我们把神经网络在训练集上进行训练,然后根据验证集的误差情况使用早停策略进行优化,最后在测试集上测试网络的性能。我们的结果优于最近一个基于知识的全原子统计势。本论文的内容安排如下:第一章主要介绍了 RNA和人工神经网络的相关背景知识;第二章主要介绍了基于多层神经网络的用于三级结构预测的RNA打分函数;第三章对本文做出了总结,并对这个工作进行了展望。
其他文献
由于回旋行波管具有输出功率高、工作频带宽等优点,在军用高分辨率成像雷达、非致命性武器、毫米波通信和电子对抗等领域中得到广泛的应用,而这些应用都要求其能够长时间持续
简单图G的一个全k-标号是指一个映射λ:V∪E→ {1,2,…,k}.它被称为是G的一个点非正规全k-标号,如果对于图G的任意两个不同的点x和y来说,wt(x)和wt(y)是不同的.其中图G的任意
中国传统民居是我国重要的民族文化遗产,其深厚的文化内涵成为近些年绘画创作的热门题材。怀念故土、追寻人与自然的和谐相处、各地特有的民风民俗,民居形式美学都促使着传统民居成为重要艺术载体。通过对优秀民居绘画作品的借鉴与吸收,结合自己在创作实践中的真实感受,针对湘南民居的产生环境、历史发展,探究湘南民居题材在艺术作品当中所蕴含的艺术特色和形式语言。传统文化题材版画在历史的进程中不断发展,在题材的选择与作
行波管自研制成功以来,在国民经济与国防建设中,已经取得了举足轻重的地位。为此,研制高效、可靠的行波管是当前以及将来国民和国防关注的焦点。实际中,行波管的研制主要分为
随着电力系统的不断发展,电能的应用领域不断增多,使得人们对电力系统稳定性的要求也越来越高,快速、有效地对系统受扰后未来的稳定性进行准确预测已成为保证电力系统安全稳定运行、提升电能供应可靠性的重要手段之一。近年来,同步相量测量装置和人工智能技术不断发展,使得许多机器学习方法被应用于暂态稳定预测当中,给问题的解决提供了一种新的思路。然而,由于机器学习处理数据的能力有限,因此该方法仍然存在很多局限。为了
在统计学中,如何较好地拟合一组给定数据的密度函数并给出密度曲线的参数形式一直备受关注。尤其是实际问题中经常遇见的删失数据和多峰数据的拟合,不但要求密度曲线具有高度
背景骨骼肌缺损和功能障碍会对人体外形和运动系统造成严重影响。骨骼肌干细胞移植为肌肉疾病提供了新的治疗途径。卫星细胞(satellite cells,SCs)作为骨骼肌来源干细胞(skel
在统计回归分析研究中,选择合适的设计矩阵是十分的重要,一方面要求选择的因素尽可能的少以达到简化模型减小计算量的效果;另一方面又要求设计矩阵内的因素之间能够相互正交,
蒸汽冷凝传热广泛应用于电力、空调制冷、热泵和化工等领域。强化冷凝传热对提高能源利用效率和保护环境具有重要意义。滴状冷凝由于具备较高的传热性能而得到了广泛关注。滴状冷凝过程中液滴是传热过程中的主要热阻,其动态行为与表面润湿性息息相关,故可通过调节表面润湿性来调控冷凝液滴的行为,进而强化冷凝传热。从仿生角度出发,基于协同排液的基本思想,创新性制备超亲水-疏水组合结构(SHI-SHO)。一层为经化学刻蚀
随着我国老年人口不断增加,老龄化程度不断加深,国内养老服务供给不足、需要社会组织参与到养老服务的供给中已成为多数人的共识。因此对老龄化背景下养老服务社会组织的培育