论文部分内容阅读
以Roche/454、Illumina/Solexa和ABI/SOLiD为代表的高通量测序技术能够大大降低测序的时间和成本,同时也对序列比对技术提出了更高的要求。加速序列比对一种方案是依靠比对算法与数据结构的改进,另一种方案则是利用具有更强计算能力的硬件设备对序列比对过程进行加速。在相当长一段时间内,计算机硬件的发展主要依赖于CPU频率的提高。然而随着工艺水平和物理方面的限制,CPU主频不会持续提高,多核处理器开始出现。如今,众核处理器由于其出色的性价比,逐渐成为加速序列比对的有力武器。 BWA是一个用于把低发散序列比对到一个大型参考基因组(比如人类基因组)的软件包,由于其比对速度快,准确率高,是序列比对中最常用的软件之一,特别是其最新版中加入的BWA-MEM算法,融合了FMD-index与Smith-Waterman算法的优势,在比对速度和精度上都超过了Bowtie2等比对算法。本文讨论基于众核处理器的BWA加速方法与效果。 本文实现了GPU平台加速的BWA-MEM算法,将BWA-MEM算法中的两个热点模块:SMEM查找和chain生成模块利用GPU平台进行加速,通过重构算法流程、精简需要向CUDA设备传输的数据结构,采用合理的任务划分方式来提升BWA-MEM在GPU平台的性能。我们对BWA-MEM算法的特点进行了深入分析,与GPU加速的BarraCUDA、nvBowtie的加速效果进行对比,总结了BWA-MEM算法在GPU平台加速效果受到限制的原因。 本文设计并实现了基于Intel集成众核(MIC)平台的BWA加速算法。我们将BWA移植到MIC平台,分析其性能瓶颈,针对MIC架构的硬件特性进行了深入优化,采用三级流水线隐藏数据读写时间,采用数据对齐、向量化指令充分利用MIC设备的SIMD计算能力,在单MIC设备上实现了10~12核CPU的性能,相对于基础移植版本性能提升了2~3倍。