分布式深度学习中面向模型参数的优化策略研究

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:eduaskbj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在分布式深度学习(Distributed Deep learning:DDL)的训练过程中,参数服务器(Parameter Server:PS)将参数分发到工作节点,经过节点计算后,将结果反馈到服务器进行参数优化。然而,在此过程中,由于传统的DDL系统中没有考虑到深度学习(Deep learning:DL)模型的单层结构和工作节点上的参数变化,导致了网络拥塞和异构环境下的优化性能下降。因此,本文首先提出了一个面向模型参数的优化策略来解决上述问题,并将该策略部署到PS上验证模型训练性能。同时,本文通过改进传统的随机梯度下降(Stochastic Gradient Descent:SGD)算法提出了基于模型数值延迟的随机梯度下降(Value-staleness-aware Stochastic Gradient Descent:VSGD)算法来提高PS在异构环境中的模型训练性能。本文的主要贡献如下:(1)针对DL模型中的卷积神经网络(Convolutional Neural Network:CNN)和全连接网络(Fully Connected Neural Network:FNN)在时间消耗和数据传输上的差异性,本文提出了面向模型参数的优化策略来提高网络利用率,从而提高DDL系统的模型训练性能。具体的,该策略针对DL模型中每一层参数的特点,设置相应的计算和传输优先级,从而提高系统的网络利用率并缓解网络拥塞。本文将参数优化策略部署在PS架构上进行实验,结果表明该策略可以显著提高DDL训练速度。(2)针对DDL训练过程中计算节点异构性问题,本文通过对DL过程的分析,提出了VSGD算法。具体的,该算法提前传输部分数据到服务器来比对模型数值延迟,从而调节每个工作节点的计算结果对整体模型的影响,进而提高PS架构在异构环境下的参数优化性能。本文基于Tensor Flow开发了DDL系统来实现以上算法,并在同构和异构网络环境中对系统性能进行评估。实验证明,本文所提出的架构以及方法能够得到更满意的模型训练性能。
其他文献
黑钨矿钨酸盐电极材料因稳定的物理和化学性能、环保、低成本以及良好的电化学性能等优点,成为超级电容器电极材料的研究热点。本论文采用共沉淀法制备了 Ni1-xCoxWO4(x=0、0.1、0.15和0.2)样品。由X-射线衍射(XRD)和场发射扫描电子显微镜(FESEM)知,Co掺杂对NiWO4的晶体结构和表面形貌影响不明显。X-射线光电子能谱(XPS)分析表明,Co离子是+2价的形式进入到NiWO4
随着人工智能学科的发展以及计算能力的提高,基于深度学习的人体行为识别研究已经成为热门的研究课题之一,同时也是非常有挑战性的研究难点。因为人体行为识别技术在人类社会
神经网络的落地是近几年的重要研究发展方向之一,卷积神经网络因其特性,被广泛应用在图片识别和图像处理领域。随着深层的卷积神经网络在各大数据集上的精度越来越高,其网络
环境污染已经成为我国在发展过程中不容忽视的重要问题。新疆作为我国经济发展较为落后的省份,工业化发展程度较低,环境污染程度与其他省份相比虽然较轻,但是新疆的环境污染
中医院是中药材的需求方,中药材的保质保量供应对于中医院的长远发展至关重要。随着人民群众对中医药需求的增长,中医院对中药材的需求也在迅速增长。现在的中医院大多属于公
无等待流水车间调度问题属于一类重要的组合优化问题,它广泛的存在于炼钢、食品、化工和制药等领域。当工件数目大于等于3的时候,该问题已经被证明是NP-hard问题。于是,吸引
林下伴生种是降香黄檀林分中特殊的组成部分,对维护林分系统稳定性和提高立地生长力具有重要意义。本文运用灰色关联度分析法对澄迈林场降香黄檀人工林林下伴生植被的适应性
内燃机作为一种高效率的热能动力机械,广泛应用于汽车、船舶、铁路、工程建筑等多个领域。车用柴油机向着轻便、高速、高压、大功率等方向发展,其强化指标不断提高,机械负荷不断增加,对于柴油机的设计也提出了相应的要求:提高效率、增加可靠性、减轻质量、降低燃油消耗率以及降低排放等,相应的柴油机的零部件也就有了更高的强度要求。连杆是曲柄连杆机构的重要组成部分,连杆在往复运动的工作循环中,一直受到来自最大爆发压力
信息时代,互联网上拥有着海量的文本数据,为了方便的检索和利用这些文本数据,需要让计算机“理解”文本,理解语言的核心则是理解语言语义。考虑到语言语义本身是难以表示的,
云计算作为一种广泛应用的新型商业计算模式,改变着信息的传播与服务方式,在动态共享的云环境下,以按需计费方式为云用户提供可靠服务资源。资源匹配调度作为云计算核心,其性能优劣将直接关系用户和资源供应商交互体验,影响云计算的发展。因此,在互联网商业模式背景下,如何将少而优的资源匹配给用户,实现高时效、低成本、高可靠性等多目标要求是研究云计算的关键,也是本文研究的重点。由于资源供应商和不同云用户需求重点不