生物信息学中的序列比对算法研究

来源 :中国农业大学 | 被引量 : 0次 | 上传用户:eacy_tang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
序列比对是生物信息学中一种基本的信息处理方法,对于发现核酸和蛋白质序列上的功能、结构和进化的信息具有非常重要的意义。随着生物序列数据库中序列数据的激增,开发兼有高度生物敏感性和高效率的算法就显得非常迫切。本文研究了生物信息学中的双序列和多序列比对算法,主要研究内容和取得的成果如下: 1.在经典的Ukkonen快速序列比对算法基础上,借鉴FA算法(Fast Alignment Algorithm)在计算得分矩阵时记录元素来源关系的存储方法,运用在矩阵中寻找Checkpoint点的Checkpoint技术,研究了一种基于动态规划思想的较为实用的全局双序列比对算法。 2.根据目前双序列比对的研究现状,对几种经典的双序列比对算法进行了分析介绍,并且用C++语言编程实现了这些算法,为本文研究的基于动态规划的双序列比对算法创造了对比实验条件。 3.基于多序列比对研究现状的分析,提出一种基于遗传算法的多序列比对解决方法,设计并实现了序列比对问题的遗传编码,初始群体生成方式,适应度函数计算以及选择、交叉和变异三种重要遗传操作的方式。 4.针对遗传算法容易陷入局部最优解的缺点,提出模拟退火算法与遗传算法相结合的思想,在遗传操作中加入退火操作,可明显提高多序列比对进化后期的收敛速度。 5.CLUSTAL程序是生物学界通用的多序列比对软件之一,随着同时进行比对的序列数据量的增加,其时间复杂度急剧增加,该程序无法满足大规模的序列数据比对。为进一步优化算法的运行时间,设计了基于Windows操作系统的、单机多处理器的CLUSTAL并行算法,并对CLUSTAL程序中的两两快速比对的核心算法进行了代码优化。 6.CLUSTAL程序的指导树构建采用Neighbor-joining邻位相连算法,该算法同时也是很多指导树生成专用软件的核心算法。针对其在指导树生成方面存在近似程度不高的问题,运用寻找主结点的思想,设计了Neighbor-ioining的改进算法。 7.以本文提出的序列比对算法为基础,设计并实现了一个基于Windows操作系统的中文序列比对系统及应用平台。其功能主要包括序列文件管理、序列比对算法选择、参数设置、比对结果输出和指导树查看等。 本文的研究内容是生物信息学中序列比对的改进与创新算法,经过实际测试,其生物敏感性和运算效率较之传统算法均有所提高,在此算法基础上开发的系统平台软件可以为生物信息学的研究及实践提供一定支持。
其他文献
由于相对运动、大气干扰、散焦和噪声等诸多因素的存在,导致了许多条件下获取的图像质量下降,降质图像复原的需求日益增多。图像复原是一个不适定的问题,虽然出现了不少复原
目的探索医院感染控制中微生物检验的应用与意义。方法选取2017年6月22日-2018年6月22日期间我院鼻蝶垂体瘤切除术100例患者,实施奇偶数法分组模式,对照组的50例患者进行常规
冯延巳和晏殊都是位及人臣的词人,他们年代相距不远,且在词史上都有一定的地位。冯延巳词与晏殊词有微妙的异同关系,现从词人的际遇和词风特点作异同分析。
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
图像融合是将两个或者两个以上的传感器在同一时间或不同时间获取的关于某个具体场景的图像或者图像序列信息加以综合,以生成一个新的有关此场景的解释。图像融合的主要目的是