基于锚点的多基因组序列比对算法

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:my_owenlin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多基因组序列比对是现代生物信息学研究领域非常重要的核心问题。为了能够比对多种近亲物种之间的多条基因组序列,我们迫切需要一种多基因组序列比对工具。当前基因组序列比对的研究主要集中于基因组双序列比对,而有效的多基因组序列比对算法只有少数几个,并且这些算法的比对效率较低。本文提出了一种有效的多基因组序列比对算法,该算法结合后缀数组及图模型,计算保守区域并使用现有序列比对工具完成多基因组序列比对。算法首先计算出序列之间的保守区域,然后基于图模型计算最大递增保守区域集,最后利用ClustalW比对方法来比对相邻保守区域之间的缝隙。在六组基因组(人类,老鼠,支原体等)DNA序列集上进行的序列比对实验表明,本文算法和MGA, EMAGEN等其他同类算法相比具有可比的精度,识别效率更高,时间开销更小,为解决多基因组序列比对问题提供了一个较好选择。
其他文献
随着互联网技术的快速发展,云计算作为一种新型的计算模式逐渐受到工业和学术界的关注。数据中心作为云计算的重要基础设施,由众多服务器互相连接构成,服务器中存储了许多数据,用
随着后PC时代嵌入式系统的广泛应用,一方面嵌入式系统的安全性日渐受到人们的关注,另一方面多核化已成为嵌入式系统的一个重要趋势。而RTEMS作为一款优秀的嵌入式实时操作系
随着企业业务的不断扩展,软件系统变得越来越复杂,越来越多的异构系统被牵连进来,怎样将这些异构复杂的系统集成起来便成为一个问题。企业应用集成提供了底层应用支撑系统间
当代是一个信息爆炸的时代,随着Internet的飞速发展,我们每个人每天都被大量的信息包围着,面对着海量的信息,如何有效管理利用这些信息,使其能更好的为我们服务,是一个非常值
面向服务的计算是一个崭新的分布式计算模型, Web服务是数据和信息集成的有效机制。但是随着Internet上Web服务的快速增长,自动、准确地搜索Web服务已经成为Web服务技术中的
仓储管理系统是现代物流行业的重要组成部分。仓储管理系统主要任务是对仓库中的货物、仓储货位等基本信息进行管理,优化仓库存储的效率,实现仓库中货物的出入操作和存储操作。
医学图像的配准与匹配是计算机辅助治疗的一个关键技术。在现有的医学数据库中,存在的海量数据已经无法让医生在诊断时对所有的图像进行浏览分析,计算机的辅助可以帮助医生减
无线传感器网络,又称感知网,是由大量的、廉价的、体积小的、具有通信能力的传感器节点组成的网络。同步技术是无线传感器网络的重要支撑技术,无线传感网络的许多实际应用都
聋人群体在生产和生活中,不可避免地要在聋人之间、聋人和健听人之间建立联系,手语成为聋人群体参与社会生活借助的主要交流手段。由于手语不是社会中主流的信息传播方式,极
压缩感知理论是近几年来很受欢迎的一种信号采集和处理理论。对于稀疏或可压缩信号,该理论可以以远低于奈奎斯特定理的采样率来进行数据采集,并且可以大概率的准确重构出原始