面向通用计算的GPU集群设计

被引量 : 0次 | 上传用户:liyin900101
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于超强的计算能力、高速访存带宽、支持大规模数据级并行程序设计等特点,GPU已经成为超级计算机和高性能计算(High Performance Computing, HPC)集群的主流加速器。越来越多的应用程序通过基于GPU数据并行地重新设计达到可观的加速比。因此,在HPC领域,GPU集群已经成为新的重要的研究热点,并且传统集群也正演化成为GPU加强的集群或GPU集群。本文从体系结构出发,通过对传统集群以及GPU特点的分析,总结了GPU集群体系结构特点,并指明了GPU集群中独特的异构计算特点以及强大的多层次并行计算能力。在理论研究的指导下,通过对现有计算资源的整合构建了一个节点异构GPU集群系统,并阐述了详细的GPU集群搭建步骤。主流GPU集群编程模型大多采用消息传递机制以及异构计算简单结合的方式,这种方式往往是低效而且易错的。这种模型对应用程序的描述和设计的不足根源在于其没有从编程和计算模型层面同时契合GPU众核体系结构和集群环境。Stream编程模型深入分析并行计算模式从编程模型顶层出发提供显式多层面的并行设计机制,引导程序员将程序设计的视角从简单的功能和进程划分到数据有关的计算划分,使其能够充分契合GPU集群强大的数据并行计算能力。随着处理单元的发展和集群节点的拓展,GPU集群将在节点层面趋于异构化。本文提出了一套针对异构任务在节点异构GPU集群上的能量有效调度方案。我们形式化地描述了其任务和资源模型以及能耗评估模型。通过特定的节点选择策略,减少空闲状态的能耗损失。通过任务类型划分和组合分配以及DVFS,增加CPU资源利用率。本方案从系统层面着手,能够与现有的算法和指令层面的优化方法兼容。本文从体系结构、编程模型、能耗有效性角度,对GPU集群系统进行了深入研究,提出了一整套面向GPU集群的设计方案,并且指导完成了GPU集群软硬件环境的构建,实现并部署了适合GPU集群大规模数据级并行能力的流处理并行编程环境。最后对节点异构GPU集群能耗有效性研究,从系统层面提出了一套能耗有效性任务调度方案。本文对面向通用计算的GPU集群系统的设计具有系统指导意义。
其他文献
在分析物流业发展概况的基础上,以物流上市公司盐田港为例,运用财务分析法和SWOT分析法从盈利能力、经营能力、偿债能力、发展能力等方面对盐田港竞争能力进行了深入分析,明
黑曲霉突变株DM-1是一株产纤维素酶菌株,其中β葡萄糖苷酶活性特别高。采用粗纤维原料固体培养,发酵96小时(培养温度31℃),其滤纸酶活和β葡萄糖苷酶活分别为95和1200mg葡萄糖/gDMh。本试验系统研究
构造围长较大的校验矩阵,是提高二进制和多进制QC-LDPC码译码性能的一种有效手段.本文提出一种不需要借助于任何计算机搜索步骤,能够直接构造出围长至少为8的QC-LDPC码的显式
利用大连理工大学的土工静力-动力液压三轴-扭转动多能剪切仪对相对密度为30 %的钙质砂进行了扭转和竖向循环耦合试验,探讨了初始主应力方向角对钙质砂动强度和残余应变发展
智障学生在语文阅读中存在朗读、理解、运用等诸多障碍,不仅影响其认知与能力的发展,也阻碍其基本语文素养的形成。文章借鉴情境教学理论,结合新课程理念和课堂教学实例进行
子旋博士经常为美容行业的企业担任顾问,为业内人所熟知。他是《美容财智》的忠实读者之一,面对每一期杂志上所刊登的缤纷的广告,很想做一下客观的点评。他说:我不了解广告主和其
如何与'独二代'家长有效沟通,需要班主任认清'独二代'这个特殊学生群体的成长背景,在与其家长沟通、交流时,可以采用以下策略:不卑不亢、平等尊重;分门别类
基于协同学、区域经济理论基本原理和区域物流基本理论的分析发现,临空经济与区域物流在发展要素上具有高度契合性和协同性,两者的发展目标基本一致。在临空经济与区域物流协
目前针对干清粪工艺条件下的奶牛场废水的处理技术尚不够成熟,国家新推出的《畜禽养殖业水污染物排放标准》(征求意见稿)将排放标准进一步提高,增强处理效果、开发新的处理工艺成
众所周知,2011年我国的慈善事业遇到了巨大的挑战,“郭美美事件”等热点问题引起了社会的广泛关注,慈善组织法律监管中存在的问题暴露无遗,2012年的全国两会上,不少代表和委