基于DNA序列部分——整体特征相似性的核小体定位研究

来源 :内蒙古大学 | 被引量 : 0次 | 上传用户:philippetr
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
核小体是真核生物染色质的基本组成单位,它的位置与多种生物学过程紧密相关,如DNA复制、RNA剪切以及染色质重塑等等。随着高通量测序技术的发展,越来越多的学者对核小体定位进行了研究,取得了许多成果。为了进一步探索核小体定位机制,本文对核小体定位的理论预测模型做出了进一步完善。  本文基于DNA序列的自相似性特征、分别利用多样性增量与相对熵提出了两种新的核心DNA预测模型,并在相关数据集上验证了该方法的有效性。  首先,基于DNA序列的自相似性特征与多样性增量,本文提出了基于DNA序列的k-mer信息的广义多样性增量预测模型(GID-BP)用于预测核心DNA。本文将此模型应用到人类、蠕虫、果蝇与酵母的核小体定位中以验证模型的有效性。实验结果表明本文预测模型在人类、蠕虫、果蝇与酵母数据集上的分类准确率分别达到了87.89%,89.76%,85.50%,99.94%。  其次,基于DNA序列的自相似性特征与相对熵,本文提出了基于DNA序列的k-mer信息的广义相对熵模型(GRE-SVM)用于预测核心DNA。本文将此模型应用到人类、蠕虫、果蝇与酵母的核小体定位中以验证模型的有效性。实验结果表明在人类、蠕虫、果蝇与酵母数据集上的分类准确率分别达到了88.61%,88.46%,83.76%,100%。  同时,本文在GID-BP模型中应用基于贡献率与spearman相关系数的关键因素分析法来寻找核小体定位过程中的关键因素,在GRE-SVM模型中应用基于随机森林的关键因素分析法来寻找核小体定位过程中的关键因素。基于随机森林的关键因素分析法的详细过程如下所示:首先,通过随机森林的方法计算与核小体定位相关的特征向量的权重;然后,将得到的特征权重与预先设置的阈值进行比较分析;最后,通过比较结果获得与核小体定位密切相关的特征向量。实验结果表明不同生物中影响核小体定位的关键因素是不同的:(1)GID-BP模型表明正负六联体在核小体定位中发挥着重要的作用;(2)GRE-SVM模型表明正四联体、正负五联体与正负六联体在四种生物的核小体定位过程中均发挥着重要的作用。
其他文献
农村小学信息技术教育处在一个机遇和挑战并存的时期,了解现状,不断探索,是实现信息技术教育巨大飞跃的必由之路.纵观农村小学信息技术教育的发展现状,还存在许多亟待解决的
本文主要从讲好故事的几个核心要素:悬念、细节、情感、冲突来谈如何在初中历史教学中讲好历史故事.
随着信息技术在人们生活中广泛的应用,高职院校的计算机管理专业也受到了人们的关注.为了实现这方面良好的教学,本文将对当下该专业人才培养过程中出现的问题进行分析,并根据
[摘 要] 文化自信是具有历史性、现实性的时代命题。在“文化自信”视域下分析非遗舞蹈与高职舞蹈教育的融合方式,对于我国非遗文化的传承与发展来说具有积极的意义。主要对“文化自信”视域下湖南非遗舞蹈融入高职舞蹈教育的策略进行简单分析,希望可以为非遗舞蹈的传承与发展提供参考。  [关 键 词] “文化自信”视域;湖南非遗舞蹈;高职舞蹈教育;策略  [中图分类号] G712 [
党校是培养我党优秀领导干部的主要场所,是加强党性锻炼的熔炉,是党的政治思想知识的研究机构.在当今时代发展进步的背景下,党校在政治理论教学过程中,也应该深刻反思教学模
中国古代一种极为重要的政权组织形式,它始于秦汉时期,终于辛亥革命,其贯穿于中国整个封建社会,它就是专制主义中央集权制度.中国历史上,专制主义中央集权制度扮演着举重若轻
东汉末年,群雄四起,社会动荡不安,直到魏、蜀、吴三分天下,局势才稍有缓和.曹操建魏,占有一席之地,必有其过人之处.魏初士家制度的实行可谓其法宝,对促进当时战争的胜利、经