DNA序列模体识别问题的迭代算法

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:amuro111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
DNA序列模体对研究基因的表达调控有重要作用,模体识别问题是计算生物学中一个热点问题。本文就模体识别问题做了相关的介绍并提出了一个新的计算方法,主要内容安排如下:第一章是绪论,简略介绍DNA模体识别问题的生物背景及意义,以及该问题目前的研究情况。第二章介绍DNA模体识别问题的相关生物知识,包括基因表达过程中的转录和翻译,以及基因表达调控中涉及的转录因子及其结合位点。第三章给出DNA模体识别问题的详细描述,并介绍模体表示方法,包括一致序列表示、矩阵表示、logo图表示;还介绍模体的评价方式,包括信息量评价、一致性得分、适应度得分。第四章介绍计算DNA模体识别问题的算法,分别介绍了遗传算法、蚁群算法、Gibbs采样算法及其扩展算法在模体识别问题中的应用。第五章是本文的精髓,提出一个新的模体识别的迭代算法,采用遗传算法框架,从模体长度较短时开始迭代,利用遗传变异操作以及本文提出的加一操作,使模体长度逐渐加一,最终计算出标准模体长度下的模体模式。本文对模拟数据和真实的生物数据都做了实验,结果显示预测的结果与真实情况相符。对于同一数据CRP,本文方法比Gibbs Sampler、GA、GARPS这三种方法的得分高。
其他文献
温贮备可修系统,是可靠性理论模型中一个非常重要的研究内容之一.修复非新是依赖于众多现实问题的一个实际情况.在现实生产中,部件发生失效经修理后,未必能够修复如新,而是在
压缩感知/压缩传感理论(Compressed Sensing简称CS理论)作为信号及图像处理领域的一个热门方向,已经在计算机科学、应用数学和电气工程领域吸引了相当多的关注。这表明压缩感
随机微分方程不仅在数学科学、物理学等自然科学方面有着非常广泛的应用,同时也是工程技术、经济管理以及金融工程方面最常用的数学模型之一。  本文针对一类二阶随机微分方
针对一种基于混沌特性的有限域Chebyshev多项式和RSA结合的公钥密码算法的问题,通过对密钥生成的初始值和条件的限定,加密算法中对中间值的限定给出了一种改进方法,改进后的
在本篇论文中,我们主要讨论多重序列比对上的次优正则联合结构的预测,以及核糖核酸(RNA)的拓扑性质。  在第一章中,我们首先简要地介绍了核糖核酸之间相互作用问题(RIP)的背景
随机进程代数PEPA是一种形式化语言,它通过组合化的方式来形式地描述一些分布式计算机和移动通信等并发系统,并可以用来提取和分析系统的功能特性,比如有无死锁、吞吐量和响应时