【摘 要】
:
深度神经网络(Deep Neural Network,DNN)并行化已成为高性能计算领域一个热点问题,也是解决大规模模型训练缓慢的最佳方法之一。然而随着深度学习应用场景的不断发展,包含更多参数信息的网络模型被设计出来解决更加复杂的任务,导致模型训练过程中耗时不断增加。传统并行方法主要包括数据并行和模型并行,这两种并行方式具有通信开销高、并行增益低等局限性。为解决上述问题,本文提出一种基于数据并行的
【基金项目】
:
国家自然科学基金青年项目:基于线程级推测的非规则算法并行化研究(61602388)
论文部分内容阅读
深度神经网络(Deep Neural Network,DNN)并行化已成为高性能计算领域一个热点问题,也是解决大规模模型训练缓慢的最佳方法之一。然而随着深度学习应用场景的不断发展,包含更多参数信息的网络模型被设计出来解决更加复杂的任务,导致模型训练过程中耗时不断增加。传统并行方法主要包括数据并行和模型并行,这两种并行方式具有通信开销高、并行增益低等局限性。为解决上述问题,本文提出一种基于数据并行的深度神经网络并行加速方法,主要贡献如下:(1)提出一种基于层间的粗粒度并行方法。针对传统数据并行和模型并行存在训练时间过长和通信开销较大等问题,本文结合数据并行和流水线并行对模型训练过程进行加速。首先,提出一种层间流水线混合并行架构,使用该混合并行架构可以充分挖掘出深度神经网络中的内在并行性。其次,提出一种模型划分算法,该算法旨在寻找神经网络模型的最佳划分和最大化多流之间的负载均衡。然后,提出一种层间流水线并行机制,最大化计算与通信重叠的训练过程和确保神经网络训练过程中可以高效并发地利用计算资源。最后,提出一种基于多流的梯度同步策略,旨在进一步减少训练过程中梯度同步的开销。(2)提出一种层内细粒度加速优化方法。针对深度卷积层计算时间较长和计算过程中内存利用率不高等问题,本文提出一种深度卷积层加速优化方法,该方法在计算过程中可以充分利用计算资源,从而缩短层内的计算时间。首先,对深度卷积层并行性进行分析,提出一种基于TVM的两级划分策略,该策略在加速计算过程的同时可以减少共享内存冲突。其次,提出深度卷积层一级划分方法和二级划分方法,针对二级划分方法提出最佳参数配置算法,旨在找到计算开销最小的参数组合。最后通过结合两级划分策略和虚拟线程进一步加速层内的计算过程。本文所提出的方法在单机多卡的实验环境上进行测试,采用三个标准数据集(CIFAR10,CIFAR100,Caltech 101)分别对ResNet-18、ResNet-34,以及ResNet-50进行性能评估。实验结果表明,三个模型使用提出的多流层间并行方法训练时间相比于传统训练方法有一定的加速效果,在提升训练速度的同时能够保证模型的收敛性,ResNet-18、ResNet-34和ResNet-50相比于传统训练方法的加速比分别为1.47×、1.39×和2.44×。本文提出的优化方法在深度神经网络训练中能有效提高训练过程中的加速比性能,在深度学习并行化领域有一定的实际意义。
其他文献
为改善聚氨酯/环氧树脂胶粘剂的耐水性、耐热性及力学性能,以γ-氨丙基三乙氧基硅烷作为有机硅组分对聚氨酯/环氧树脂胶粘剂进行改性,形成有机硅与聚氨酯/环氧树脂的互穿网络结构,最终制成性能优异的有机硅改性聚氨酯/环氧树脂胶粘剂。采用单一变量法,探讨不同含量的有机硅对改性聚氨酯/环氧树脂胶粘剂的性能影响。结果表明,有机硅的加入使得聚氨酯/环氧树脂胶粘剂的接触角增大,吸水率减小,力学强度增加,总体热质量损
<正>亚马逊王莲以其巨大奇特的叶片和硕大、变色的花朵著称,叶片直径长达2米,可安全承载体重70公斤的成人。亚马逊王莲是圭亚那的国花,原产南美洲热带水域,是睡莲科王莲属多年生或一年生大型浮叶草本植物。亚马逊王莲的历史记录,始于维多利亚时代的植物学家。1837年10月,维多利亚女王登基的第一年,由英国政府雇佣的罗伯特·肖伯格在南美洲的一个新的英国殖民地英属圭亚那发现了亚马逊王莲。
民心是最大的政治,人民是中国共产党执政兴国的最大底气。中国共产党在百年探索历程中,对人民历史地位的认识不断丰富,对党同人民群众关系的内涵发掘愈加深入,逐步形成、确立了人民至上的价值理念。从人民利益出发,中国共产党领导建构了一整套将人民放在最高位置的政治制度,创设了以诉求表达、利益整合和权力分配为核心的整体利益与个体利益平衡机制,搭建了保证民主真实性的体制机制。在制度运转中,中国共产党探索创立了民主
化工是江苏省重要支柱产业,但近年来不断出现的化工安全环保事故带来重大人员伤亡和财产损失,尤其是2019年响水天嘉宜特别重大爆炸事故教训极其深刻。为探寻化工行业整治及绿色发展路径,在回顾2006年以来先后开展的9轮化工行业整治的基础上,分析了江苏省化工行业布局、规模、创新、从业人员素质方面存在的诸多问题,分析了化工产业发展面临的产业集聚、优胜劣汰等方面面临的机遇和挑战,提出了江苏省化工行业绿色转型发
改革开放后,流行音乐进入中国内地市场并在国内迅速发展。作为大众娱乐文化的代表,流行音乐深受广大听众喜爱,其从发展之初的逐步摸索到现在已经全面繁荣。与此同时,为了满足不同听众的音乐需求,流行音乐开始广泛与其他音乐风格相结合,其中中国传统民族音乐与流行音乐的结合最为紧密,诞生了许多优秀的流行音乐作品,民族元素的加入也成为中国流行音乐区别于国外流行音乐的一大重要特征。在中国流行音乐越发趋向国际化、多元化
学前教育师资队伍建设制约着学前教育的发展,直接影响着学前教育的办学质量。通过对海南省十个地市(县)的幼儿园师资队伍建设现状的调研,发现海南省幼儿园师资队伍建设在教师仍存在着师资队伍的结构尚失衡、师资准入门槛把关不严、教师工资待遇偏低、培训体系有待完善等问题。基于此,对海南省幼儿园师资队伍建设的优化路径进行分析,从加强顶层设计、完善准入—评价机制、加大正面宣传、更新培训理念等方面着手,促进海南省幼儿
本文简单对声音特性、声级计进行介绍,总结了影响声级计工作的因素,以满足相关工程技术人员在其测量中避免和减少它们对试验结果的影响,提高测量结果的准确性。
文章通过文献分析、案例研究、实地考察等方法,对西双版纳地区傣族民居的居住环境和居住模式、建筑形态及材料、空间特点进行研究,分析傣族民居现状及面临的问题,在传承传统民居风貌和文化的基础上,探析傣族民居在建筑形态、空间功能、技术与材料方面的现代化适应性更新设计策略,以期为少数民族地区提供民居更新设计的新方法,为实现传统民居的发展、提高人民生活居住水平提供思路。
一个企业转型升级往往凭借技术的进步,但一个地区产业升级凭借的不仅仅是技术上的革新,而是一系列的政策支持,大量人力物力的参与,企业间的相互配合等,才有可能实现整个地区的产业升级。化工产业作为资本、技术密集型行业,要想实现产业升级往往需要大量的投入。对于欠发达地区化工产业转型升级,文章以菏泽市化工产业为切入点,通过描述菏泽市化工产业发展现状、采取的政策措施、化工产业转型中的困难和问题等,表明欠发达地区
【目的】随着信息时代的不断发展,科学技术成为农村产业发展的根本推动力,为进一步激活农村发展活力,推动农村一二三产业融合成为实现乡村振兴的有力支撑,【方法】本文基于向量自回归(VAR)模型,以2011—2019年我国科技及工业相关数据为样本,构建科技产出、科技投入、农村三产融合三个一级指标和九个二级指标体系,对我国农村三产融合与科技创新投入关系进行研究。【结果】实证分析结果表明,农村一二三产业融合程