结合自适应采样的分布式机器学习

来源 :南京大学 | 被引量 : 0次 | 上传用户:yangyng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,以机器学习为代表的人工智能技术已被成功地应用到计算机视觉、语音处理、自然语言处理等多个领域。同时,随着应用场景的日益复杂,人们往往需要使用海量的训练数据与大规模的机器学习模型来达成目标。在大规模机器学习任务中,仅使用单台机器进行模型训练已经很难满足人们的需求,使用多台机器联合工作的分布式机器学习技术已成为解决该类任务的主流方案。多数机器学习任务的训练过程中,每一轮迭代都需要所有训练样本参与训练。对于拥有大量训练样本的任务,一轮迭代就需要消耗大量时间。除此之外,多台机器在分布式训练过程中不可避免的需要进行通信来交换信息,这会带来额外的通信开销。所以在分布式训练中,计算开销和通信开销都会对训练的速度产生影响。我们在前期的研究中提出了自适应采样算法ADASS,能够降低训练过程中的计算开销。本文将ADASS算法引入分布式机器学习,设计了结合自适应采样的分布式机器学习算法ADASS-DML。同时,本文还设计了用于减小ADASS-DML通信开销的算法,为分布式机器学习提供了一套计算和通信同时高效的解决方案。具体来说,本文包括以下三个创新点:一、本文将自适应采样应用到分布式机器学习中,在当前常用的通信框架(包括参数服务器框架和Ring All Reduce框架)下设计并实现了结合自适应采样的分布式机器学习算法ADASS-DML。该算法能根据实时的训练情况,自适应地挑选部分重要的训练样本去参与下一轮迭代,从而在不牺牲模型准确率的情况下加速分布式机器学习的训练过程。本文通过在真实数据集上的实验验证了ADASS-DML算法的有效性,并比较了两种通信框架下ADASS-DML算法的训练速度。随后发现即使在训练速度较快的Ring All Reduce框架下,通信开销仍是影响分布式训练效率的瓶颈之一,为此本文又设计了以下两种通信压缩算法来解决这一问题。二、在Ring All Reduce框架中,工作节点之间通信的梯度通常是32比特的浮点数。目前在其他通信框架上已有一些量化算法能将通信的张量用更低的比特表示以降低通信开销,但这些算法不能直接应用于Ring All Reduce框架。因此,本文在Ring All Reduce框架下设计并实现了结合自适应采样的量化算法Q-ADASS。在真实数据集上的实验表明,Q-ADASS算法能在进行自适应采样的同时使用低比特表示通信的张量,并且不对最终模型的准确率产生影响。三、量化算法带来的通信压缩效果还不能完全解决ADASS-DML算法中的通信开销问题。本文针对Ring All Reduce框架的特点设计并实现了一种结合自适应采样的随机稀疏算法RS-ADASS。该算法在每次模型同步时不需要通信完整的梯度,只需要通信梯度的少部分维度。在真实数据集上的实验表明,该算法能进一步减少训练的通信开销,且不会降低最终模型的准确率。
其他文献
近期,深度生成式模型在高维数据生成、数据域迁移等领域上展现出了卓越的性能。与用于分类任务的深度学习模型不同,深度生成式模型会在训练过程中对数据分布进行建模,并利用
随着工业与科学技术的迅速发展,人们对合金材料的强度和硬度有了越来越高的要求的同时,也对材料的塑韧性等综合力学性能有更高的需求。大多数金属间化合物由于具有高强度和高韧性而展示出巨大的应用潜力,受到越来越多的关注。然而金属间化合物在室温的条件下塑韧性较差。因此,如何提高金属间化合物的综合力学性能(高强、高韧和高塑性)成为学者的主要研究方向。本文分别以B2结构的ZrCo基和ZrCu基合金为研究对象,以高
当今世界,由于信息时代的到来,收到大量有用信息的同时也包含大批量的冗杂信息,影响人们对事物的正确判断。在这种情况下,如何在大批量的信息中去除冗杂信息,挑选出真正对人
有机太阳能电池因廉价、柔性、可以卷对卷制备、质地轻薄等独特的性质引起了科学家高度的关注。经过科学家的研究和探索,近几年太阳能电池的功率转换效率(PCE)得到了迅速地提升。目前基于单异质结的太阳能电池PCE已经可以达到16%以上,叠层有机太阳能电池PCE已突破17%。这使人们看到有机太阳能电池未来产业化的可能性。同时加速了有机光伏材料的研究与开发,近几年发展起来的受体-给体-受体(A-D-A)型稠环
近年来,环境激素类药物污染物在饮用水中不断被检出。此类污染物在饮用水氯化消毒过程中会产生不同的氯化消毒副产物,很可能比母体化合物具有更大的生物毒性,从而对人类健康
轨道角动量键控(OAM-SK)是利用携带轨道角动量的涡旋光束达到信息传输目的的一种光通信方式,将涡旋光束的不同OAM模式与数字信号进行一一对应实现信号调制。卷积神经网络(CNN
低空数字探空仪能够测量低空大气垂直分布的温度、相对湿度、大气压力等气象参数,计算出低空大气折射率,为低空大气波导诊断系统提供重要数据参数。低空大气波导诊断系统能有
相变材料作为一种储热量较大的材料,可以解决太阳能的热能供给和需求失配的矛盾。众多相变材料中以石蜡最为常用,它具有相变潜热高,价格低廉等优点;但是也存在导热性差和固-液相变时易发生泄露等缺陷。将石蜡进行微胶囊化处理,可以很好地解决这些问题。本文针对木材太阳能干燥中的储热场合,选取58#固体石蜡为芯材,三聚氰胺-尿素-甲醛(MUF)树脂作为壁材,制备了石蜡/MUF树脂微胶囊。拟将此微胶囊用于上述场合的
点特征广泛用于基于特征的视觉同时定位与地图重建(visual simultaneous localizat ion and mapping)或者视觉里程计(visual odo metry)系统,但是线特征却很少用在这些系统,
习近平总书记指出“土地流转和多种形式规模经营,是发展现代农业的必由之路”。2013年以来,启动的土地确权为农村土地流转创造了良好条件。2016年以来,实行的农村土地“三权