基于机器学习及长程相关性的RNA二级结构预测

来源 :浙江工商大学 | 被引量 : 0次 | 上传用户:kevinchen12344
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
核糖核苷酸分子RNA作为生物体内一种大分子,它是存在于生物体中重要的物质,不仅与脱氧核糖核苷酸分子DNA和蛋白质共同协作维持生物体的各项活动的进行,并且在DNA和蛋白质合成中扮演着重要的角色。研究发现,对RNA结构的研究能够帮助我们更加全面地了解RNA分子功能,这样就有利于生物研究学者探索RNA与DNA和蛋白质间的相互关系,从而了解生物体功能并且了解和治疗疾病。RNA分子结构由三部分结构组成:一级序列、二级结构、三级空间结构。RNA三级空间结构是由二级结构单元之间的相互作用,扭曲、折叠等等在空间中形成的稳定结构,因此RNA二级结构的预测对于RNA结构来说起着重要的作用,如何有效地RNA二级结构成为生物信息学领域的重要研究问题之一。传统地预测RNA二级结构的方法都是用实验物理、化学等方法预测其结构。但RNA分子本身具有晶体难以获得、分子降解速度快等特点,所以用物理实验的方法预测其二级结构相对耗时长、成本高。而近年来,人工智能的算法日益崛起,用人工智能的方法在预测分类股票、房价等等各种类别数据的应用上取得了很不错的成效。本文中重点对人工智能中的机器学习中不同的算法预测RNA二级结构做了对比和分析。论文中首先介绍了RNA二级结构的生物学概念和RNA二级结构预测方法的研究现状。根据比较机器学习的相关算法,确定了本文的主要研究工作:(1)深入研究目前机器学习中的各类算法在RNA二级结构预测上的应用,对这些算法的原理和性能优劣进行分析比较。并将这些算法如何预测RNA二级结构以及其预测效率结果做了进一步对比分析,从而选择最佳算法模型。(2)实验通过RNA内在的长程相关性特征信息进一步发现RNA的碱基配对数量这一个特征向量,将其融入到实验先前的算法模型中,从而大大提升了RNA二级结构预测的效率。(3)针对生物学上RNA有些二级结构特征还没有被发现这个缺陷。实验选用深度学习算法中的循环神经网络(RNN)算法来作为新的模型。这个模型的优势在于它可以将数据映射到高维空间中,模型自主地发现RNA一级序列中我们用肉眼或者简单算法发现不了的内在特征。
其他文献
道德建设是中国共产党执政过程中不可小视的重要部分,它直接影响到执政党能否拥有稳固的群众基础,是否民心所向,同时也是衡量执政党执政是否具有合道德性的关键所在。中国共
竞争是商品经济的必然产物,是市场经济的重要特征,随着我国社会主义市场经济体制的逐步完善,竞争在我国经济运行中的作用日益凸显。在国际上,随着世界市场经济体制的建立形成
立体视觉技术在最近几十年取得了飞速的发展,由于它具有非接触、速度快、精度高等特点,己经被大量应用在无损检测、场景感知、机器人导航、医学辅助、虚拟现实、军事探测等需要深度恢复,三维目标重建与描述等工作的领域。立体视觉大致有三种表现形式:基于双目相机的立体视觉、基于单目相机的立体视觉以及基于相机加结构光的立体视觉。三种实现形式各有优缺点,其中单目立体视觉是指采用一组成像系统或两个处于同一光轴上单独成像
为探究城市景观带小气候舒适度随不同景观要素配比变化的特征和规律,本文以上海世博公园和陆家嘴滨江带两处为实验地,选择在夏季极端天气下进行小气候测试和热舒适感受调查。
税收是国家公共财政最主要的收入形式和来源,税务部门作为组织国家财政收入的政府职能部门,为了更好地完成国家税收目标,让纳税人享受到非常高质量、便捷的服务就是税务机关
官能团的还原是有机合成中必不可少的步骤。主族金属氢化物,尤其是硼和铝的金属氢化物可以完成此转变,但是它们参与的反应需要化学计量的试剂,这使得它们对还原反应没有吸引
本论文以中国地质调查局发展研究中心地质矿产调查评价项目《基础地质图更新与数据库研发》为依托,该项目在已有的海量基础地质图数据基础上,通过开展典型地区不同比例尺数据
刮膜式分子蒸馏器作为目前应用最广泛的分子蒸馏蒸发器,由于其复杂的物理、化学反应及物质能量的转换与传递,使得整个生产系统具备非线性、强耦合、大滞后、不确定性等特点,
滇西兰坪中-新生代盆地内大量产出规模不等的脉状Cu-Ag矿床,前人对包括白洋厂矿床在内的主要矿床的容矿地层岩性、矿床地质及地球化学特征与矿质来源示踪的研究表明,区内的脉
研究背景和目的:Hedgehog信号通路在细胞生长、胚胎形成及维持人体组织内环境稳定方面扮演重要的角色。同时更多研究表明Hedgehog信号参与多种肿瘤的形成及发展,如基底细胞癌