面向图计算的GPU体系结构优化关键技术研究

来源 :国防科技大学 | 被引量 : 0次 | 上传用户：syblanseyouyu

【摘要】

：

大规模图计算分析已经成为目前众多数据分析应用的重要组成部分。图(Graph)作为最基本的抽象数据结构之一,常常被用来表示不同个体间的关系。现在它已经成为许多应用领域的数

【作者】

：

郭辉

【出处】

：

国防科技大学

【发表日期】

：

2018年01期

【关键词】

：

GPU 大规模图计算应用数据缓存管理数据预取负载平衡

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

大规模图计算分析已经成为目前众多数据分析应用的重要组成部分。图(Graph)作为最基本的抽象数据结构之一,常常被用来表示不同个体间的关系。现在它已经成为许多应用领域的数据表示方式,例如网页搜索排名、社交网络、医药研究、遗传学、传染病学等。GPU已经成为大规模并行计算的主流平台,它可以比多核处理器使用更少的能耗但获取更高的性能。许多面向图计算应用的软件编程框架模型已经开始使用GPU加速图计算算法的性能。本文针对使用GPU平台加速图计算算法存在的负载不平衡和控制流分歧(Control Divergence)等问题,研究分析了图计算算法在GPU上运行时遇到的指令执行和存储访问瓶颈问题,并从GPU体系结构的角度出发,设计并实现了相应的硬件体系结构解决方案,有效解决了图计算应用负载不平衡、数据缓存空间利用率低、高延迟的数据访问等问题,从而提高了GPU执行图计算算法的性能,满足未来解决大规模图计算问题的需求。本文取得的研究成果如下:1.提出并设计实现了一种动态的多粒度GPU数据缓存管理机制。使用GPU并行加速图计算算法存在着诸如存储访问分歧(Memory Divergence)、细粒度数据存储访问以及片上数据缓存空间利用率低等问题,导致GPU无法充分发挥出其应有的计算性能。本文针对图计算算法存储访问请求的数据大小与GPU片上一级数据缓存的缓存块大小之间不匹配的矛盾,提出了动态的多粒度数据缓存管理机制,并在模拟器上设计实现了相应的硬件缓存管理单元。这项缓存管理机制可以解决由不规则存储访问导致的一级数据缓存存储空间利用率低效的问题,有效提高了具有不规则存储访问特点的应用在GPU上执行效率。实验结果表明,相比于现有的GPU一级数据缓存设计以及细粒度的缓存管理机制,所提出的数据缓存管理机制有效地提高了一级数据缓存的空间利用率以及应用程序的性能。2.提出并设计实现了一种面向图数据结构的GPU数据预取技术。虽然针对固定模式数据存储访问模式的数据预取技术已经较为成熟,但是针对不规则的数据存储访问模式的数据预取技术目前还没有找到较好的解决方法。本文通过对宽度优先搜索算法的数据结构访问模式的分析,提出了面向图数据结构的GPU数据预取技术,并在模拟器上设计实现了相应的硬件数据预取单元以及辅助的CUDA编程接口。该技术利用显式获取的图数据结构访问信息,提高了数据预取的准确性,减少了数据预取对存储带宽的消耗,有效地减少了数据访问的延迟。实验结果表明,相比于已有的GPU数据预取技术,所提出的GPU数据预取技术能够有效地提高对不规则存储访问的数据预取准确性,降低了存储访问延迟,进而使GPU执行图计算算法的性能获得巨大提升。3.提出并设计实现了一个新颖的面向图计算的高效GPU体系结构。虽然目前已经提出许多基于GPU的图计算编程框架模型,但是图计算应用的负载平衡问题无法通过软件方法彻底解决。本文针对软件实现的图计算编程框架模型进行分析,提出了一个新颖的面向图计算的高效GPU体系结构,并在模拟器上设计实现了相应的硬件结构以及CUDA编程模型。该技术消除了软件负载平衡策略进行预处理时的指令消耗,实现了SM核内线程间以及SM核间的高效负载平衡。实验结果表明,相比于软件实现的图计算编程框架模型,所提出的GPU体系结构能够有效地减少执行负载平衡的开销,高效地平衡各个计算单元间的工作负载,最终极大地提高了GPU执行图计算算法的吞吐率。

其他文献

基于大规模优化方法的IMU角动态试验设计

导航系统的精度是衡量一个捷联式惯性导航系统优劣的一个极为重要的性能指标。国内外为此展开一系列的相关误差模型的研究,在整个误差源中惯性测量单元(Inertial Measurement

学位

惯性测量元件动态误差标定大规模优化共轭梯度法减空间搜索法

云环境下基于动态预测的虚拟机管理算法研究

云计算(cloud computing)是基于互联网的相关服务的增加、使用和交付的模式,通常涉及通过互联网来提供动态易扩展且经常是虚拟化的资源。其广泛的应用使用户在获得高效可靠又

学位

云计算装箱问题时间预测模型动态预测技术层次分析法虚拟机部署与迁移

基于激光测距机的“低慢小”目标运动信息感知技术

近年来,“低空、慢速、小型”航空器的发展极为迅速,由于低慢小目标具有发现难、探测难、识别难的特点,给国家安全和国民经济带来诸多威胁,因此迫切需要发展多元协同探测系统

学位

低慢小脉冲激光测距距离信息角度信息

古建筑照片的前景分割和匹配算法研究

随着虚拟现实技术的发展及在各个领域的应用普及,三维重建技术的重要性越来越凸显。基于照片的三维重建技术是一种重要的方法和手段,它根据单幅或两幅图像的数据恢复出空间点

学位

古建筑照片三维重建技术前景分割特征点匹配去除误匹配

两层无线传感器网中能量高效的多维数据隐私保护范围查询协议

数据查询是无线传感器网络完成监控和侦查任务主要手段。因此,无线传感器网络需要通过数据隐私保护技术防止信息泄露和被篡改,利用数据管理技术来完成数据查询任务。所以研究适用于无线传感器网络的具有隐私保护能力的数据查询技术是十分迫切和必要的。这些现有的研究工作在隐私安全性或感知节点能耗中仍存在不足之处,而且大部分是基于一维数据的。基于此,对多维数据范围查询的能耗、数据隐私问题进行了深入研究。基于此,本篇论

学位

WSN网络安全范围查询前缀验证编码质数聚集完整性验证

基于RANSAC-TLS的机载LiDAR精度评定关键技术研究

近年来,机载Li DAR测量技术在城市建模、交通规划、林业监测等方面得到广泛的应用,其数据获取的精度能否达到应用要求是业内人员关注的重点问题,因此建立可靠的精度评定模型、优化精度评定的方法,对于提高机载Li DAR评定的精度十分必要。对此,很多学者提出各种无控制、无检校场的方式来对机载雷达进行精度评定,然而这些大多都是停留在理论阶段,且需要大量的后期处理工作,实现难度大。在实际生产应用当中,通过布

学位

机载LiDAR精度评定RANSAC-TLS算法边缘点拟合仿真计算

装饰面层快速精准定位开孔施工工艺

以某工程在装饰装修阶段采用开孔定位设备进行面层开孔为例,阐述了该工艺的施工原理、工艺流程、施工技术要点及质量安全控制措施。

会议

开孔定位设备定位开孔

基于修正Timoshenko梁理论的地基梁横向振动研究

地基梁作为土木工程领域中的基本构件被广泛应用,桥梁工程中的轻型桥台、铁道工程中的轨道梁、房建工程中的基础梁等均可视作此类构件。目前对各种地基梁静力计算模型研究较为充分,而现实中这些基本工程构件发生的破坏往往是移动荷载引起的振动破坏。传统的地基梁横向振动研究大多基于Euler梁理论,这些理论虽有较大的适用空间,但在梁高跨比较大,尤其在分析结构高频振动响应时由于未考虑梁的剪切变形影响则会带来较大误差;

学位

修正Timoshenko梁地基梁轻型桥台横向振动复模态

G公司财务风险识别及其控制研究

在当前的市场经济环境下,企业之间竞争激烈,特别是对本文所要研究的乳制品行业来说,产品更新换代较快,市场需求也在不断的变化,产业壁垒较低,很容易有新的企业加入竞争队伍中,所以公司在保证经营效益的情况下,要时刻注意财务风险问题,要有科学合理的风险分析方法和控制手段,这样才能使得企业在复杂的外部环境中健康稳定的发展。本文以G公司为研究对象,从研究背景出发,基于国内外的对财务风险的研究现状和水平,对财务风

学位

G公司财务风险风险识别风险控制

基于贝叶斯网络的机车轴温监测报警自适应判据研究

随着我国高速铁路的不断发展,高铁技术的不断创新,极大的方便了人们的出行,同时,对机车的安全运行也提出了越来越高的要求。轴承作为机车运行过程中重要的支撑和旋转部件,它

学位

贝叶斯网络轴承报警

面向图计算的GPU体系结构优化关键技术研究

其他学术论文