空分GPU上关于提高多任务吞吐率的研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:lanbing510
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着GPU的广泛使用,有关GPU资源利用率的提升问题也得到了广泛关注。单应用独占GPU或者时分共享GPU已经不能充分利用GPU上的大量资源了。空分共享GPU是一种常用的提升GPU资源利用率的方法。空分共享GPU可以利用程序之间资源互补来提升GPU资源利用率。现有的空分技术不能支持动态的改变程序的资源数量,单调的资源分配方式限制了应用程序充分利用资源的能力。本文实现了一种可以动态改变程序资源数量的进程池机制,使得程序可以更灵活的调度资源。在此基础上本文针对两种应用场景,分别提出了两种调度算法以提升GPU资源利用率。本文针对多个简单程序共享GPU的场景,提出了静态调度算法。简单程序指程序只有一种类型的任务,对资源的需求单一。静态调度算法通过平衡各种资源,减少了资源不足带来的瓶颈问题,提升了GPU的资源利用率,使GPU整体吞吐率最高可提升27.9%。本文针对多个复杂程序共享GPU的场景,提出了动态调度算法。复杂程序对资源的需求会不断变化。动态调度算法通过提高不同类型任务同时执行的概率,提升了资源互补利用的概率,提升了GPU的资源利用率,使GPU整体吞吐率最高可提升13.6%。
其他文献
由于不同被试的生理信号之间存在着个体差异性,脑机接口系统在推向大范围现实应用时受到了严重的阻碍。在使用传统的机器学习方法进行跨被试的情绪与疲劳检测时,个体差异性造成的数据分布差异使得模型的精度大幅下降。另一方面,现有的一些方法主要关注迁移学习中的域适应方法,训练个性化模型对新用户进行检测。然而,个性化模型的训练和校准仍然需要付出大量的时间和高昂的成本对新用户进行数据采集,这使得个性化的解决方案效率
在半导体芯片生产流程中,比如氧化、沉积流程,硅片将组批后加工。工件的组批以及批次的调度是个需要联合优化的问题,被称为批处理机调度问题。此外,批处理加工设备昂贵、生产负荷高,需要对设备进行预防性维护。本文研究考虑预防性维护的批处理调度问题,针对批处理机组批、批次调度和预防性维护联合优化问题,建立数学模型并设计求解算法。本文主要讨论两个问题,一个是考虑灵活周期预防性维护的批处理调度问题,另一个是考虑机
现代通信技术中,CP-OFDM(Cyclic-Prefix Orthogonal Frequency Division Multiplexing)是被4G LTE(Long Term Evolution)以及5G NR(New Radio)等标准做为物理层调制波形的高效多载波调制技术。而CP-OFDM技术带外辐射严重,不能有效利用空白频谱资源。因此FBMC-OQAM(Offset Quadratu
随着通信技术的不断发展,通信信号调制手段日新月异,传统的调制识别方法难以满足实际需要。在现代化通信对抗中,及时准确地获取信号的调制方式是进行信息提取和干扰引导的重要前提。论文针对现代通信对抗中的通信侦察系统,立足于实战中“实时+准确”的需要,研究设计了一种融合决策树与高阶累积量的调制识别算法,对侦获的信号进行调制分析。论文致力于分析通信信号的统计特征与频谱特性,并对两个具有递进关系的目标进行了研究
中国5G标准的发布及商用化服务的快速推进,给超高清产业带来极大的助力。直播编解码器作为一个负责对直播信号进行实时编解码处理的工业化软硬件产品,是现有高清直播端到端流程中必不可少的一环。目前业内对超高清直播业务场景评测方法认知尚未普及,从而对业务支撑所需的直播编解码器的评测研究工作相对欠缺。因此,有必要研究一种面向超高清的直播编解码器技术评测方法。本文首先分析和研究了超高清视频,特别是HDR相关技术
当前无线移动通信传输数据呈倍数增长,导致频谱资源紧张的现状。传统无线通信发展基于OSI七层模型,物理层专注于从物理频谱带宽等角度逼近通信容量。同时,传统信源信道联合编码研究已经相对成熟,一定程度上从数据无差错传输角度提升信道容量。然而传统信源信道联合编码仍存在诸多问题。一方面,传统信源信道联合编码问题往往通过分离定律将其分解为信源编码、信道编码等若干步骤。分离定律的基本理论是将通信的母问题分解为多
随着5G时代的来临和物联网(Internet of Things)的飞速发展,物联网智能设备不断普及,且数量飞速增加。各类监控器、感知器、包括人们日常使用的移动智能手机,每时每刻都在产生着大量的数据。硬件性能的提升使得互联网的边缘,大到宏基站,主交换机,小到网关服务器,边缘服务器甚至路由器等设备都具有了一定的计算和存储能力。因此,边缘计算的概念被提出来,将数据的实时计算和预处理从云端迁移到边缘,既
乘法运算一直是数字信号处理中不可或缺的数字逻辑运算操作,也是衡量很多数字信号处理器芯片运算性能的主要评价指标。一方面,为了实现较高的精度,数字信号处理器中通常在运算中使用浮点乘法器来代替定点乘法器。另一方面,近些年来在深度神经网络和一些图像处理等容错应用中,可以通过降低部分计算的精度来降低电路的功耗和提高运算性能。针对上述应用领域,本文在深入调研近似计算理论和乘法器电路结构的基础上,研究了近似乘法
情绪,是一种与思维、感知和行为相关的精神状态。探索情绪产生的机理以及情绪在各种不同条件和环境下的变化与特性,可以帮助人们更好地理解自己,可以为开发更加自然、友好的人机交互系统提供技术支撑,也可以帮助实现许多精神疾病的客观评估与辅助治疗。跨文化的情绪差异研究同样也是心理学、认知科学、神经科学和精神医学等学科的一个重要研究分支。已经有许多科学研究发现,对于不同文化背景的人群,对情感的理解存在共性与差异
随着计算机图形学的发展,人们开始对自然界各种物理现象进行模拟。其中,自然界的流体运动是一种看似简单却极为复杂的运动,模拟流体的运动在人们生活中应用极为广泛。然而,在众多流体模拟的算法中,传统数值方法都需要通过迭代运算,这种运算方式往往耗时很长,因此对流体模拟过程的加速研究尤为重要。近年来,在流体模拟的领域中,流体的特征提取是被人们广泛研究的课题。其中基于涡旋细丝的流体特征提取方法可以提供来自现实世