基于众核处理器的BWA序列比对算法加速研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:liongliong429
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
以Roche/454、Illumina/Solexa和ABI/SOLiD为代表的高通量测序技术能够大大降低测序的时间和成本,同时也对序列比对技术提出了更高的要求。加速序列比对一种方案是依靠比对算法与数据结构的改进,另一种方案则是利用具有更强计算能力的硬件设备对序列比对过程进行加速。在相当长一段时间内,计算机硬件的发展主要依赖于CPU频率的提高。然而随着工艺水平和物理方面的限制,CPU主频不会持续提高,多核处理器开始出现。如今,众核处理器由于其出色的性价比,逐渐成为加速序列比对的有力武器。  BWA是一个用于把低发散序列比对到一个大型参考基因组(比如人类基因组)的软件包,由于其比对速度快,准确率高,是序列比对中最常用的软件之一,特别是其最新版中加入的BWA-MEM算法,融合了FMD-index与Smith-Waterman算法的优势,在比对速度和精度上都超过了Bowtie2等比对算法。本文讨论基于众核处理器的BWA加速方法与效果。  本文实现了GPU平台加速的BWA-MEM算法,将BWA-MEM算法中的两个热点模块:SMEM查找和chain生成模块利用GPU平台进行加速,通过重构算法流程、精简需要向CUDA设备传输的数据结构,采用合理的任务划分方式来提升BWA-MEM在GPU平台的性能。我们对BWA-MEM算法的特点进行了深入分析,与GPU加速的BarraCUDA、nvBowtie的加速效果进行对比,总结了BWA-MEM算法在GPU平台加速效果受到限制的原因。  本文设计并实现了基于Intel集成众核(MIC)平台的BWA加速算法。我们将BWA移植到MIC平台,分析其性能瓶颈,针对MIC架构的硬件特性进行了深入优化,采用三级流水线隐藏数据读写时间,采用数据对齐、向量化指令充分利用MIC设备的SIMD计算能力,在单MIC设备上实现了10~12核CPU的性能,相对于基础移植版本性能提升了2~3倍。
其他文献
随着多媒体信息技术的不断发展,数字视频技术的应用越来越普遍,尤其是室外的视频监控应用,如道路交通、住宅小区、停车场等。然而逐渐增多的雾、霾等恶劣天气,使得采集到的室外视
荔枝、柑橘采摘效率的提高是提升岭南地区特色水果质量、降低成本的重要途径。农业采收机器人的应用是提高水果采摘效率的有效途径之一。但由于荔枝、柑橘果实形态、颜色、纹
全过程计算机辅助动画自动生成技术是人工智能与多媒体技术相结合的全新动画制作技术,它将电影艺术、人工智能和图形学技术引入动画生成全过程,底层以图形学技术作为支撑,上层运
卫星移动通信系统可以通过提供与地面蜂窝系统兼容的语音和数据服务,来解决传统蜂窝通信系统的业务范围受地理环境和运营成本制约的问题。新一代地球静止轨道卫星通信系统——
随着三维GIS的兴起和发展以及数据采集技术的进步,三维GIS中大规模矢量数据的可视化已经成为当前GIS空间数据可视化所要解决的一个重要问题。而目前,三维GIS中矢量数据的可视化
智能视频监控系统是计算机视觉领域的重要应用,运动目标检测是智能视频监控系统中的关键技术,阴影去除是运动目标检测中的重要环节。本文结合图像亮度归一化和二维交叉熵的思
良好的性能是程序设计开发的重要目标之一。结合硬件平台的系统结构特点,分析程序行为、寻找性能瓶颈是一个重要课题。硬件性能计数器是现代处理器芯片提供的一组专用寄存器
随着计算机技术的发展,系统仿真作为重要辅助分析手段被各航天大国广泛使用,用于提高空间任务设计和运行的质量和效率。然而,空间任务的各组成部分和各运行环节都充斥着大量的不
随着计算机网络技术的飞速发展,互联网已经成为信息获取的重要渠道,越来越多的信息通过网络进行传输和交换。XML作为一种可扩展标记语言,凭借其跨平台、可扩展的优势,被广泛用于
随着用户在互联网上交互模式的变化,微博等社交平台上均包含大量的实时信息及评论,针对这些短文本信息的情感语义挖掘对于公共事件的舆情分析、商业产品的市场营销、突发事件的