Hadoop云平台下基于资源感知的作业调度算法研究

来源 :云南大学 | 被引量 : 0次 | 上传用户:ldlhongerfly
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
云计算是一种新型的商业模式和计算模式,它通过对计算资源、存储资源、软件服务的商品化处理,以更具可靠、廉价、高速的方式提供给用户使用,实现资源拥有者与使用者的分离。大数据是使用通用软件工具来捕捉,管理和数据处理时间超过容许时间的数据集,它具有容量大、种类多、产生速度快等特点。云计算平台为大数据分析提供了硬件基础,大数据分析也为云计算的发展提供了应用需求。分析即为服务的理念就是云计算与大数据分析发展融合的产物。但通常的情况下,云计算平台是一个由许多性能差异较大的计算节点组成的异构集群。这使得云环境常出现负载不均衡的现象,这严重影响了云计算系统的整体性能,因此对异构云平台中的任务调度技术进行研究就显得格外重要。通过学习研究,本文首先对云计算与大数据的相关概念与特点进行了阐述;对开源云平台Hadoop的关键技术一-MapReduce编程模型、分布式文件系统HDFS做了深入研究,并分析比较了现在较为流行的几种并行编程模式。然后对Hadoop平台下的三种作业调度算法:先入先出调度算法(FIFO)、公平份额调度算法(Fair Scheduler)和计算能力调度算法(Capacity Scheduler)的设计思路和实现方法进行研究,在此基础上,设计一种新的Hadoop作业调度算法,命名为基于资源感知的调度算法(The Scheduler Algorithm Based on Resource-Aware),以下简称为资源感知调度器Resource-Aware Scheduler,简写为RAs。本文设计的资源感知调度算法是综合考虑计算节点性能的异构性、作业处理数据量的差异性、任务的多样性来设计的,在此过程中我们引入合理度的概念来刻画任务分配方案,用它来权衡计算节点、作业数据量、任务多样性之间的关系,实现云计算平台的运行效率与资源合理分配的整体效果最大化。因此具有最大分配合理度的方案即为最好的任务分配策略。最终实现不同计算节点的差异使用、不同类型作业的差别服务、不同任务的差异执行,从而提高系统的整体响应时间和系统资源的利用率。
其他文献
随着钻井信息技术发展及其应用的推广,原有钻井信息系统中产生了大量宝贵的钻井历史数据,但是钻井数据共享程度低,信息相对封闭.因此,如何集成与整合原有各种钻井业务系统中
本文对建筑图自动识别和算量软件VHRecQS用户接口的目标功能、设计思想和实现方法等方面进行了深入的分析和研究,给出了保证VHRecQS用户接口友善、高效、智能、易用、稳定的一
该文首先概述了Web服务的定义,服务模型以及其协议栈.同时还介绍了业务流程执行语言BPE4WS的主要内容,并给出了一个简单的业务流程实现机制.然后详细分析了业务流程执行语言B
随着应用软件的大型化和复杂化,软件构件之间的集成和通信变得越加困难。人们提出了中间件的概念来试图解决这一问题,然而,由于缺少统一的标准和规范,最终造成大量互不兼容的中间
该文首先对卫星通信的发展过程、通信特点做了分析说明,其中包括卫星网络的卫星轨道高度、卫星运行的周期性等物理特性以及卫星网络的星座模型、拓扑结构等.接着该文对卫星网
随着Internet的快速发展,信息安全问题越来越成为一个严重的问题。不象网络发展的初期阶段,入侵者仅仅局限于专家级知识的计算机高手,现在Internet上到处可以找到各种各样的黑客
数据采集系统是构成工业自动化监控系统的核心和基础.随着DAS系统不断发展,尤其是多媒体数据采集系统的出现使DAS系统面临新的挑战.该文的研究目标是从对等网络这个技术角度
随着信息技术特别是网络技术的发展,电子媒体的传播极为迅捷。但随之而来的盗版和侵权行为也日益猖獗。同时也出现了多种保护电子媒体信息安全的技术。数字图像水印技术作为一
该文以数字视频压缩技术为基础,以视频信息的存储和网络传输为重点,以简单实用的视频运动检测为特色,实现了具有自主知识产权的数字视频监控系统Blue-Eye的主要核心部件.多路
该文主要介绍专家系统开发工具CLIPS事实存储技术的相关理论的研究情况,以及功能扩展工作.首先,该文从应用的角度分析了研究CLIPS事实理论的必要性,分析了CLIPS的各种模板结