面向MapReduce任务的云数据中心网络资源协同优化

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:chen126
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
MapReduce作为大数据处理最重要的计算模型之一,由于其易于编程、具有良好的扩展性和高容错性的优点,已被广泛应用于各个领域,如信息技术、数据挖掘、人工智能、数学计算等。MapReduce应用的网络传输阶段需要占用云数据中心大量的网络带宽,这些数据传输产生了大量的网络负载,不仅会造成网络拥塞,还会给应用自身的性能带来损害。如何使不同的应用在保证自身服务质量的前提下共享网络资源,避免带宽竞争和网络拥塞,降低作业完成时间,是云数据中心亟待解决的问题。现有的针对面向MapReduce任务的云数据中心网络资源优化研究存在以下问题:在网络层,缺少有效的流量识别机制,忽略了应用和数据流自身的属性和对网络的特殊需求;此外,当前的流调度策略没有考虑coflow之间的依赖关系,这严重降低了流调度对降低作业完成时间的有效性。在应用层,现有的任务放置和调度方法无法针对实时的网络状态和节点容量做出合理的优化。因此,本文自底向上地从网络层和应用层解决面向MapReduce任务的云数据中心网络资源的共享问题。主要工作如下:(1)实现了一种基于OpenFlow协议的流标记和识别机制,通过网络过滤器更改Ipv4数据包头的Tos字段来区分标记不同应用的数据流。(2)研究了在任务截止时间约束条件下的相互依赖的coflow调度问题,构造了一个最小化作业平均完成时间的优化问题,并相应地提出了两层调度算法。通过优先满足瓶颈时间段和瓶颈链路的带宽分配实现在作业层面的调度;采用优先级调度和加权平均调度算法来保证coflow之间不同的依赖性,实现作业内部coflow的调度。(3)综合考虑了传输数据量、实时带宽容量、传输距离和节点计算资源容量对任务完成时间的影响,进一步提出了通过放置Reduce任务来减少Shuffle阶段传输代价的优化模型。模拟实验结果表明,本文提出的两层调度算法比传统的最短作业优先方法减少了约18%的作业平均完成时间,在有截止时间限制的条件下,提升作业完成率21%。最小传输代价任务放置策略相比平均放置算法和本地化放置算法实现了更加合理的任务放置比例,达到了对面向MapReduce任务的云数据中心网络资源的优化目的。
其他文献
利用2000—2010年城镇居民国内旅游消费数据和ELES模型从边际消费倾向、基本需求、收入弹性及价格弹性四方面实证分析城镇居民的国内旅游消费结构,得出结论为城镇居民国内基
目的观察医用臭氧联合超声波治疗膝关节滑膜炎的临床效果,以及对血清白细胞介素-1β(IL-1β)、白细胞介素-6(IL-6)和肿瘤坏死因子(TNF-α)的影响。方法选取100例膝关节滑膜炎
近八年来,我们根据地理学科的特点,在不断研究加强学生读图、填图、绘图、分析图象的教学实践中,逐步提高了对地理图象系统在地理教学中的地位和作用的认识,进而研究总结出
在从熟人社会向陌生人世界转变的背景下,组织化合作动员是调动政府、社区、驻区单位和群团组织、社会组织、大众传媒以及社区居民的有效途径。XW区的文明创建实践表明,组织化
目的比较布托啡诺与芬太尼分别联用丙泊酚在无痛纤维结肠镜检查中的临床效果。方法选择行纤维结肠镜检查且主动要求施行腹痛腹静的患者60例,随机分为布托啡诺组(B组)和芬太尼组
论文分析了海峡两岸战略性新兴产业集群协同演进的六大"演化代",阐述了两岸产业集群持续创新能力演进机理。并以闽台LED产业集群为例,采用多链扩展改进的产业技术路线图,对两
利用岩石力学伺服试验机,对尺寸为80 mm×160 mm×30 mm的断续三裂隙砂岩试样进行了单轴压缩试验,研究了岩桥倾角2对断续三裂隙砂岩(=30°和1=60°)强度破坏和裂纹扩展特征的
复合型导电高分子材料是将导电填料添加到聚合物基体中制得的一种具有导电性能的复合材料。由于其在电子器件、电磁屏蔽材料、抗静电材料、化学传感器等方面广阔的应用前景,
乡村旅游从20世纪80年代末在我国兴起,而后成为推动广大乡村,特别是山、老、边、贫地区脱贫致富全面建设小康社会的重要产业,在带动农村社会经济繁荣发展、提升地方整体形象
<正>新常态下,央企要推进EAP本土化应用、模块化构建、特色化发展,促进员工身心健康,打造和谐幸福企业。近10年来,EAP在我国逐步得到推广。新常态下,央企要将EAP纳入企业一体