分布异构集群下的MapReduce作业调度

来源 :东南大学 | 被引量 : 0次 | 上传用户:firelord128
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
分布异构集群下的MapReduce作业(独立MapReduce作业或MapReduce工作流)调度的主要问题是任务与资源间的合理匹配。实际云环境中资源的有限性、MapReduce作业处理数据的分布性以及不同类型MapReduce作业资源请求量的异构性,为MapReduce作业或MapReduce工作流调度过程中满足截止期、数据本地化、资源利用率等带来极大挑战。本文围绕MapReduce作业调度,分别结合最大完工时间、能效优化和收益代价展开研究调查,设计了基于分布异构集群的时间感知MapReduce作业调度方法、基于分布异构集群的能耗感知MapReduce作业调度方法和基于分布异构机器的收益感知MapReduce工作流调度方法。主要工作如下:1、基于分布异构集群的时间感知MapReduce作业调度:考虑数据本地化、作业截止期和自适应心跳等约束以最小化多个独立MapReduce作业的最大完工时间为优化目标。将map任务分配到分布式集群处理以减少数据传输时间;reduce任务处理考虑中间数据传输时间和任务执行时间,选择具有最早完成时间的集群,减少MapReduce作业的完成时间;根据map任务与reduce任务最大处理数据量的比例,将MapReduce作业截止期划分为map阶段截止期和reduce阶段截止期;将该问题建模为指派问题。依据作业各阶段的任务处理时间计算自适应心跳间隔,MapReduce作业在每个心跳周期内按照截止期排序,利用匈牙利算法将任务分配至合适的资源槽以减少作业完成时间。实验结果表明,相比于已有算法,所提算法可得到更好性能。2、基于分布异构集群的能耗感知MapReduce作业调度:考虑作业截止期、数据本地化和资源利用率等因素以最小化分布异构集群的能量消耗为优化目标。对该问题建模并提出一个动态MapReduce作业调度框架。MapReduce作业根据作业截止期、作业可分配的资源槽数目和作业预估执行时间排序;不同任务从相应的机架层本地机器、集群层本地机器和远程机器中选择最有价值的资源槽分配以改善数据本地化;计算集群中可用资源槽的更新除查找可用资源槽外,还要根据节点当前的CPU、内存和带宽利用率采用模糊逻辑动态改变节点中资源槽的数目以提高资源利用率。实验结果表明,提出的启发式算法所消耗的计算集群能量要少于已有算法。3、基于分布异构机器的收益感知MapReduce工作流调度:考虑工作流截止期和数据本地化等约束以最大化资源管理者的收益代价为优化目标。对该问题提出改进的工作流调度架构、给出数学模型和一个工作流调度框架。依据已有Chain Map/Chain Reduce,MapReduce工作流利用动态规划转换以合理减少数据传输时间;工作流截止期根据MapReduce作业的预估执行时间、作业浮动区间[1]和作业层级划分为MapReduce作业截止期;按照工作流、MapReduce作业和任务的调度序列给出4种不同的任务列表构造方法;MapReduce工作流调度引入复本策略以改善数据本地化;将任务分配至具有最小完成时间的机器来增加资源管理者的收益。实验结果表明,相比于已有策略,提出的工作流调度算法使得资源管理者可获取更多的收益。
其他文献
以数学的视角看计数问题,它是代数学和统计学的基本问题之一,从理论计算机科学的视角看计数问题,它是计算机科学基础理论的研究课题之一,更是一类应用问题(包括NPC问题)近似最优解问题求解方案的重要步骤。计数问题求解的是搜索空间中满足条件的解的个数。当搜索空间规模较小时,一般采用枚举的方法得到计数问题的解,反之,枚举算法时间复杂度太高,求解问题代价太高,难以满足现实需要。随着数据集规模的激增,为提高解决
随着物联网、5G通信、人工智能和高性能计算等信息技术的兴起,高速率、大容量、低损耗的光子集成回路(PIC)已成为各类新型信息系统的技术基础,各种功能光子集成器件(PIDs)不断涌现。PIDs功能的拓展和性能的提高与波导材料及结构密切相关。周期电磁结构(PEMS)波导具有结构设计灵活、材料选择多样、电磁操控能力强等优势,为小尺寸、高性能、大规模集成PIDs的实现提供了新的技术途径。论文将PEMS波导
由于软件系统的复杂性,理解现有软件已成为软件生命周期所有阶段中最昂贵的任务之一。据统计,理解软件系统花费了软件工程中多达60%的工作量。从遗留系统中恢复设计信息是一项相当具有挑战性的任务,即使对于70K到280K源代码行的中型项目,也需要经验丰富的设计师平均花费100个小时来创建准确的架构。识别软件模式(software pattern)是理解软件系统的重要手段之一。包括架构模式(architec
由于其实时性、无创成像、操作灵活以及低成本的优点,二维心脏超声已经发展成为心脏评估中最为频繁使用的医学影像模态。对成对心尖观超声图像(心尖二腔观和心尖四腔观)序列中左心室的量化及分割是心脏评估的重要诊断方法。成对心尖观超声图像序列能够提供多视角以及多维度的心脏活动状况。一方面,它可以提供在心脏活动中左心室各维指标的定量估测,包括长轴维度(Long-axis Dimension,LAD),短轴维度(
学位
随着机动车保有量的逐年增长,机动车尾气污染已成为我国空气污染的重要来源。机动车尾气污染中占比最高的是黑烟车尾气污染。降低黑烟车尾气污染需要从车流中识别黑烟车。基于道路监控视频分析的黑烟车识别方法是目前的主流,但面临着容易漏报和误报的难题。解决该问题的核心是研究最具区分能力的黑烟特征。本文围绕黑烟特征展开研究,分别从黑烟图像生成、黑烟传统特征、黑烟深度特征和黑烟密度特征等四个方面进行深入研究。主要研
本文针对机床进给传动系统中存在的参数变化和建模误差等问题,提出了相应的在线参数估测和伺服控制方法,旨在提高进给传动系统在不同运行条件下的跟踪性能和稳定性。近年来,高速加工快速发展,为了保证进给传动系统在高速运行时的跟踪精度,需要尽可能地提高控制系统的闭环带宽。然而,当闭环带宽接近或者超过共振模态的自然频率后,参考轨迹和外部干扰可能会激发共振模态,引起的结构振动将影响跟踪精度,致使加工品质降低。另一
用户请求具有泊松到达、一般随机到达等不同模式,具有不同忍耐度、截止期等约束;服务资源通常为单队列或多队列的异构处理器,其服务方式服从指数或其它随机分布。这些模式和约束组合成多类复杂排队模型,如何为每类供需服务确定合适的处理器数量并合理调度以优化响应时间和功耗、租赁成本、系统能耗、服务提供商收益等不同目标是云计算的关键问题之一。针对具有忍耐度、截止期等不同约束的泊松到达用户请求,分别研究单队列和多队
由于水平荷载和地震液化引起的桩基侧移过大或桩身结构强度破坏等工程事故屡见不鲜,有效提升软弱地层中桩基础的水平承载力与抗震性能是岩土工程中亟需解决的挑战,也是桩基工程研究的热点和难点问题。劲芯复合桩(简称复合桩)是将水泥土搅拌桩(或高压旋喷桩)与高强度的预制混凝土管桩联合形成的一种复合材料新桩型。工程实践表明预制混凝土管桩周围的水泥土可显著提高其竖向承载力,但国内外对劲芯复合桩的水平承载性状与抗震性
快速有效的道路排水设计是保证降雨条件下路面行车安全和提升道路服务水平的重要环节。当降雨强度超过沥青路面排水能力时,在路表面或面层内部会形成超渗流,超渗流包括路面的汇流过程与面层内部的渗流过程。形成于路表的汇流导致路面出现积水,降低路面行车安全;形成于路面内部的渗流会冲刷、侵蚀路面材料,破坏道路结构承载力与耐久性。为深入探究沥青路面超渗流行为对行车安全与道路结构排水的影响,本文基于水动力学、渗流力学