论文部分内容阅读
随着人类基因组计划(HGP)的实施,生物信息学成为当今最重要的学科之一.生物信息学可以看作是集统计学,数学和计算科学于一体的学科.主要用来分析生物序列,即:DNA、RNA和氨基酸(蛋白质)序列.序列比对是生物信息学中最基本、最重要的方法.通过序列比对,可以发现生物序列的功能、结构和进化信息,因而序列比对是生物信息学的基础.在本文的第一章,首先介绍了序列比对方法和得分方案.序列比对包括全局序列比对和局部序列比对.从比对序列的数目来划分,又包括两两序列比对和多重序列比对.接着,我们给出了一些序列比对的算法.第二章,介绍了BLAST算法(基本的局部比对搜索工具),这个算法是建立在统计理论基础上的,并从两个方面出发,证明了BLAST算法.第三章,给出了隐马尔可夫模型,介绍了怎样从多条序列建立隐马尔可夫模型,并用隐马尔可夫模型来进行多重序列比对.第四章,我们讨论了生物网络中的局部图比对和motif搜索.在得分函数的基础上,我们为拓扑motifs发展一个搜索算法,该算法称为图比对,这是一个与序列比对有些相似的方法.在文章最后,对BLAST算法、隐马尔可夫模型(HMM)和图比对作了讨论,分析了算法存在的缺点,并且为将来进一步研究给出了几点建议.