基于CNTK的深度学习任务能耗优化的研究

来源 :电子科技大学 | 被引量 : 4次 | 上传用户:wwangruir
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
最近,深度学习技术已经成功应用到各种问题。深度学习的成功归功于日益累积暴增的数据量,并且多层人工神经层对输入数据具有的高表征能力,而GPU通过显著缩短训练模型参数的时间,在深度学习里充当着重要的角色。最近数年来各种针对深度学习的GPU集群在各个企业和科研机构等被建立,GPU集群在大企业中通常由成百上千个节点组成,如此巨大的集群长时间运行,消耗了大量能耗,增加了系统的不稳定性和企业的运营成本。所以,在大规模GPU集群中减少深度学习任务能耗,从经济角度为企业和科研机构减少费用,同时也能达到真正的绿色环保。传统的GPU或者普通计算机集群在运行时候并没有考虑到节省能耗的问题,当集群启动一段时间闲置后,所有节点处于长时间的空负载状态,或者很多节点的GPU等宝贵资源的使用率比较低,因此能源使用效率比较低。在关于集群多GPU训练模型或者预测模型的研究基本都是基于性能的,而且基于深度学习任务本身的特殊性,大部分的调度算法直接应用在GPU集群上无法取得较好的效果,造成大量的能耗浪费。本文针对上述问题,基于深度学习CNTK平台以GPU集群和容器化资源调度的深度学习相关节能调度技术为主要研究对象,深入分析现有GPU集群特点和现有调度方法的不足,对GPU集群训练和容器化深度学习任务调度提出减少能耗的解决方法。本文主要工作如下:(1)首先,本文分析了深度学习训练GPU集群节能的可行性和解决思路,并定义了能耗度量模型,提出了一种针对深度学习训练的GPU集群的节能调度算法;(2)其次,本文针对新出现的基于容器化资源调度的深度学习场景,对其提出了深度学习容器化资源最小能耗的整合方案以及基于延时的全局动态扩箱装箱算法(Delayed Global Dynamic Docker Expanded Packing,DGDDEP);(3)最后,通过设计测试用例,测试了大量的深度学习的数据.经过大量真实数据的测试,验证了所提出的方法在GPU集群上的节能效果,并且针对深度学习容器化资源调度场景,验证了基于GPU和内存使用率双阈值的源容器选择和DGDDEP算法在容器分配时的节能效果。
其他文献
<正> 所谓步态是指人体在推进中从失去平衡到恢复平衡的向前移动过程。正常情况下,1岁~1岁半是幼儿开始从扶物行走,逐渐发展到独立行走的阶段。处于学步期的幼儿,为了避免跌跤
期刊
随着护理质量评价着重于过程和成效的考评,寻求一种科学、全面的评价系统,用于评价护士工作优劣,是目前护理管理中的难题。我院采用分布式数据库构建护士工作评价系统,对每个护士
从抗生、竞争和诱导系统抗性三个方面对拮抗细菌C-02防治棉花黄萎病的机理展开了研究,结果表明,C-02分泌的抗菌蛋白能溶解病原菌VD—11的细胞壁,抑制其致萎毒素的分泌。与病原菌
为得出适用于长沙生态有机烟叶开发的较佳肥源,找出有机无机肥最佳配比和最优组合模式,研究了无机有机肥配比对烤烟产质量的影响。结果表明,有机肥可以改善烟叶质量,提高烟株
简要回顾前50年国家棉花区域试验的发展过程,总结近10年国家棉花区域试验主要进展及推荐审定的品种,分析区试组别的变迁以及分子技术在区域试验中的应用情况。展望未来棉花区
随着互联网技术和移动通信技术的飞速发展,目前国内最为大众接受的支付方式已经从过去的现金支付、银行卡支付转变为当前的移动支付。近年来,以二维码为支付载体的电子交易模
目的:探讨肿瘤化疗患者自我效能的影响因子,为临床形成系统、有效的自我效能护理干预模式提供科学依据。方法:选择已行3个疗程、6个疗程化疗的患者各60例,应用中文版一般自我效