【摘 要】
:
随着大数据时代的来临,数据的规模性和复杂性正急剧增长。使用单一节点和传统机器学习方法进行机器学习模型训练面临着严峻的挑战。为了满足大规模机器学习算法的需求,使用分
论文部分内容阅读
随着大数据时代的来临,数据的规模性和复杂性正急剧增长。使用单一节点和传统机器学习方法进行机器学习模型训练面临着严峻的挑战。为了满足大规模机器学习算法的需求,使用分布式机器学习系统进行机器学习模型训练成为了主流。目前,大部分的分布式机器学习系统都是基于参数服务器系统的思想设计的,而参数通信一致性模型用于权衡计算与通信之间的关系。本文主要围绕如何加速分布式机器学习模型训练来展开研究。传统的分布式机器学习模型训练通常遵循整体同步并行(Bulk Synchronous Parallel,BSP)模型。该模型清晰的划分了计算阶段和通信阶段,每次对全局模型进行更新都需要等待所有计算节点进入同步屏障,即训练时间完全受限于训练速度最慢的计算节点。在集群存在性能差异的情况下,整体同步并行模型将出现严重的同步滞后问题。针对该问题,异步并行(Asynchronous Parallel,ASP)模型和延迟同步并行(Stale Synchronous Parallel,SSP)模型均利用迭代-收敛算法的容错性进行了相应的改进:各计算节点使用异步训练的方式将计算的梯度上传至参数服务器。然而,由于局部模型副本存在延迟性,使得这两种模型引发了一个新的问题,即梯度过延迟问题。针对上述问题,本文对面向分布式机器学习框架的通信优化技术进行深入研究,创新性地提出了两种参数通信一致性模型:受限同步并行(Limited Synchronous Parallel,LSP)模型和自适应受限同步并行(Adaptive Limited Synchronous Parallel,ALSP)模型。并基于这两种一致性模型实现了分布式机器学习框架Kudus。本文的主要研究工作包括以下几个方面:(1)本文深入分析了不同参数通信一致性模型的优势和不足,利用迭代-收敛算法的动态容错性,实现了一个性能驱动型通信模型——受限同步并行模型。该模型从对同步屏障进行松弛化的角度出发,对同步滞后问题进行了优化。该模型实现了受限同步屏障,使得在每次同步阶段中优先进入受限同步屏障的部分计算节点先进行同步,该模型还具有有限异步并行的特性,从而加速了分布式机器学习模型训练。本文对受限同步并行模型进行了设计与实现,并用理论分析了该模型的收敛性。(2)本文在受限同步并行模型的基础上进行了优化,实现了一个性能驱动型通信模型——自适应受限同步并行模型。针对系统结构上存在的性能动态变化、资源受限等应用场景,该模型利用迭代-收敛算法的动态容错性进行了适配,解决了梯度过延迟问题。该模型进一步将同步方式分为分组同步和全局同步,并通过性能监控系统实时收集各计算节点的性能指标,为该模型提供数据基础。该模型有效减少了组内计算节点的同步等待时间,也缩小了组间模型的延迟,从而有效地平衡了集群节点的负载并且更适应真实生产工作的集群环境。(3)本文采用参数服务器系统的设计思想,基于受限同步并行模型和自适应受限同步并行模型,实现了一种分布式机器学习框架Kudus。最后在Kudus上,对上述两种一致性模型进行了实验验证。结果表明,本文提出的受限同步并行模型和自适应受限同步并行模型有效地提高了分布式机器学习模型的训练效率。
其他文献
刑事庭前会议制度是我国“审判为中心”的诉讼制度改革中的重要内容,也是衔接审前程序与正式庭审的重要桥梁。在我国司法资源有限的情况下,兼顾公正与效率成为我国诉讼法的发展目标。庭前会议制度就是在这种背景下正式确立,对于维护司法公正,确保庭审实质化和提高诉讼效率有着重要意义。同时,我们也应看到该项制度还有许多需要完善的地方。由于法律规定原则化、立法设计笼统,导致该制度在实践中存在操作性差、适用率低、适用范
潮流计算是电力系统稳态分析中最基本电气计算。目前,随着直流负荷和分布式电源接入,以及交直流混合配电网容量不断地增加,给含分布式电源的交直流混合配电网潮流计算方法带来了新的挑战。为此,本文针对含分布式电源的交直流混合配电网潮流计算展开研究,为含分布式电源的交直流混合配电网的状态分析、规划设计及运行调度提供一种计算速度快、迭代次数少的潮流计算方法,具有实际意义和应用价值。本文通过对不同类型分布式电源运
可见光定位(Visible Light Positioning,VLP)是一项极具发展前景的技术。归功于照明设备的广泛部署以及可见光信号的直线传播特性,VLP有潜力克服无线定位存在的可靠性问题。
优质铝土矿是棕刚玉冶炼的主要原料,随着矿石品位降低,主要杂质硅是造成炉况不稳定、产品质量差、高能耗、灰渣产量大的重要因素,而灰渣主要含铝、硅、钾等成分,利用率低,造成资源浪费。因此,本文采用碱浸的方式对矿石进行脱硅,结合生产实际,对粉矿造团,以喷淋碱液的方式进行脱硅;采用常规水浸方式回收灰渣中的硫酸钾和粒度分离富集氧化铝和二氧化硅相,并将灰渣和铝土矿进行混合碱浸脱硅。重点考查焙烧温度、焙烧时间、碱
随着现代足球比赛中球员间的相互对抗程度逐渐增加,比赛节奏也愈发加快,可控制的空间越来越小,如何破解比赛中遇到的这些现实场景问题已成为教练员、运动员以及科研工作者关注的热点话题。近年来我国加大了与国外足球强国的交流,教练员、科研人员大规模分批去法国、英国、德国等高水平足球国家学习深造,同时注重科研的支撑作用,特别是快速伸缩复合训练,近年来国内外教练员与科研人员逐渐加大了对这种训练方法的实践研究。本文
发动机悬置是隔离发动机振动和路面激励的关键部件,在服役过程中承受着往复的惯性力和力矩,因此疲劳失效是其主要的失效形式。能够准确地预测发动机悬置疲劳寿命,可以确保汽
自2001年我国A股市场上首家公司退市到2019年末,共有106家企业退市,其中仅有招商南油重新上市,可见退市企业重新上市难度之大。在我国国有企业更容易获得政府等各方的支持,那么拥有国企性质的招商南油的重新上市是否主要依靠政府的支持了?这是本文研究的重点问题。为分析招商南油缘何能够重新上市,以及重新上市后的效果如何?本文从退市原因、破产重整路径、重新上市效果以及案例启示四个方面层层递进展开分析。分
区块链是一种区别于传统数据库的、不需要第三方可信机构参与的、由多个节点共同存储和维护的分布式数据库,而且链上的数据只能追加不能篡改。区块链可以为多个互相不了解的用户建立可靠的信任关系,实现不同用户间的数据共享和信息传输。但是因为区块链上的很多节点都需要对同样的数据进行计算验证,所以要求区块链上的用户交易数据都是公开的。虽然这种特性增加了数据的透明度与公信力,但是也带来了数据隐私问题。即可以根据公开
为保证道路桥梁及交通运输工具等在服役过程中的安全性,需要大量的应力传感器对其结构健康状况进行及时监测,而常用的传统光纤应力传感器存在易碎和成本较高的缺点,因此需要对结构稳定性高、成本低并且传感性能高的新型应力传感器展开研究。其中石墨烯因其优异的材料性能在高性能的应力传感器应用中得到了广泛关注,但受限于传统石墨烯的制备技术和电导率,目前基于石墨烯的应力传感器测试大部分均需导线连接,存在安装和维护不方
智能交通系统作为智慧城市发展的必然选择在车辆控制及道路管理等方面显示出了独特优势与潜力。在智能交通系统中,车辆检测与识别是该系统的重要组成部分,车型分类更是其关键任务,能有效减少交通负荷,提高交通设施运行效率和城市资源利用率,为人们的日常出行提供了基本安全保障。与此同时,在图像处理与模式识别的领域中,基于计算机视觉的深度学习技术获得了高速发展和广泛应用。因此,本文将深度学习中的卷积神经网络思想应用