基于条件随机场的RNA二级结构预测算法

来源 :北京理工大学 | 被引量 : 0次 | 上传用户:FB100087
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着越来越多的非编码基因及功能被识别和揭示,人们逐渐认识到非编码RNA的重要性。由于其结构决定功能,研究RNA的二级结构有着非常重要的意义。非编码RNA基因的数目的庞大以及生物实验的局限性,使得二级结构预测成为非编码RNA识别及其功能研究的重要途径。RNA序列的研究方法主要有两个大的方向,分别是基于多序列比较分析方法的RNA二级结构预测方法和基于单序列的RNA二级结构预测方法。本论文重点介绍单序列的处理方法:最大碱基配对数算法和基于最小自由能算法,它们是确定性动态规划类算法,但未能很好的解决伪结和准确性问题;同样介绍了基于概率论的隐马尔可夫模型(HMM)和随机上下文无关文法(SCFG),这两个算法则存在着数据归纳偏置的问题,并且存在较高的计算复杂度。条件随机场(CRFs)在图像标注、文本标注等领域应用良好,并在预测同源RNA序列的共有结构时处理的结果较好。本论文研究就是在已知一条RNA的序列编码信息之后,通过条件随机场模型方法来计算出该RNA序列的二级结构。本研究针对单个RNA序列二级结构预测中传统算法的不足,结合CRFs模型,通过改变传统的基于概率模型中严格的条件独立性假设,并在其中加入通过长期研究得到的先验知识,可以很好的解决数据归纳偏置及准确性的问题,得到理想的RNA二级结构。
其他文献
当前,信息技术已广泛应用于经济管理领域,促使我国审计环境与审计对象发生诸多变化,审计工作作为经济监督的重要组成部分也产生了重大变革,传统审计手段、审计信息化的低效应
从整地施肥、全膜覆盖、种子处理、适期播种、田间管理、病虫害防治、适期采收等方面总结了河西干旱地区板蓝根高效节水栽培技术。
<正>《中共中央、国务院分类推进事业单位改革的指导意见》(中发[2011]5号)文件提出,到2020年,要建立起功能明确、治理完善、运行高效、监管有力的管理体制和运行机制,形成基
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
期刊
金融行业信息化建设起步早,投入大,水平高。金融网络及信息安全在国家的信息安全保障体系中占有重要地位,金融系统也属于国家政策要求实施安全等级保护的11大类关键信息基础设施
我院1996~2006—06共有7例腰椎间盘突出症手术后并发脑脊液漏,经相应处理后治愈。分析如下。
企业和政治人物或政府官员之间的政治关系的建立是一个国家经济发展过程中的普遍现象,特别是在中国实现经济转型这一特有的背景下,制度和文化上的特殊性使企业和政府建立政治关
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
用缩略方式构成的语言单位叫缩略语,又叫缩略形式。公文中常见的缩略语形式是标数概括式缩略语。如我党当前开展的两项重大教育活动:“三严三实”“两学一做”。公文常使用标
[导读]联合国粮农组织的最新统计数据表明,2005—2014年全球葡萄和桃生产在面积保持稳中略降的态势的同时,产量却保持着稳中有增态势。2014年,全球葡萄收获面积和产量分别为7