基于MPI的云计算平台下计算依赖问题关键技术研究

被引量 : 1次 | 上传用户:yangying_han
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
对于高性能计算而言,由普通商用计算机组成的集群正在成为越来越流行的平台。为了充分利用集群的计算和存储能力同时简化分布式并行应用程序的设计,科研机构及科技公司研发出了一系列分布式并行计算框架以及云计算平台。但通过分析它们的编程模型,发现这些框架及云计算平台并不适用于存在计算依赖的作业或者说是不能有效地解决这类问题。本文提出了基于有向图的存在计算依赖的作业的编程模型,其核心就是用一个有向图来表达存在计算依赖的作业分解后的各个任务以及任务所执行的计算间的依赖关系。根据编程模型的结构来分析编程模型所对应并行计算框架的核心过程,研究了任务所执行计算间的依赖关系类型、依赖关系表示方法及任务调度机制。在上述基础之上,基于MPICH(消息传递接口MPI的一种具体实现)设计并实现编程模型相应的并行计算框架。MPI(Message PassingInterface)本身不提供容错机制,为了增强系统的可靠性及高可用性,本文在分析传统的基于检查点的卷回恢复协议的优势与不足之后,设计出改进的基于通信引发检查点的卷回恢复协议:采用通信引发的检查点设置协议可以确保作业从检查点恢复时的正确性;进程在设置检查点时采用户导向的检查点设置机制可以有效地减少无错运行时开销;作业在出错恢复时采用三级容错恢复协议,可以将出错恢复限制在与失败进程有直接依赖关系的进程范围内而不影响其他进程的正常执行,这样就加快了作业的出错恢复过程。为了支持存在计算依赖的作业的三级容错恢复协议,本文研究并设计了不共享通信域的Worker间通信机制。最终,程序开发人员只需按照框架的规范编写并提交各计算顶点(任务)对应的顺序执行的程序和计算顶点依赖关系图,系统自动地对存在计算依赖的作业进行分布式并行处理包括:负载平衡、任务调度、计算结果的返回、对用户透明的容错处理等。本文将适用于存在计算依赖的作业的并行计算框架的原型系统部署在实验室之前研发的基于MPI的多层容错高性能云计算平台上,使之支持存在计算依赖的作业。实验测试结果表明,原型系统可以正确有效地解决存在计算依赖的作业。
其他文献
姜是姜科姜属多年生草本植物,经干燥,炮制后我们可以得到干姜、炮姜和姜炭三种制品,其在临床上的应用各不相同。鲜姜性温,解表散寒,温中止吐,临床主治心腹冷痛、腹泻及四肢冷等疾病
<正> 珠宝文化,是指由珠宝而引发的种种文化现象;珠宝营销技巧,讲的是创造性商业行为,在它们之间是否存在联系呢?这应从珠宝本身的特征去寻找答案。珠宝,作为一种自然产物,具
目的观察安络化纤丸联合还原型谷胱甘肽治疗非酒精性脂肪性肝病(NAFLD)患者的临床疗效。方法 54例NAFLD患者被随机分为两组。给予对照组(n=27)还原型谷胱甘肽治疗,观察组(n=2
锂离子电池具有循环寿命长、无记忆效应、比能量大等许多独特的优点,在人们生活中的作用日益重要,如今锂离子电池已广泛应用于电子消费产品,如手机、数码相机、便携式笔记本
全球化为博物馆提供了机遇和挑战。面对机遇和挑战,博物馆应加强标本收藏工作,突出馆藏特色,充实藏品的科学内涵,扩大收藏的服务功能,为博物馆参与国际间竞争、交流与合作,为
核桃嫁接技术研究郝艳宾刘军(北京市农林科学院林果所100093)曾宪泉(山东历城区港沟镇农委)核桃嫁接技术的研究一直是核桃研究的最为活跃的领域,有关此方面的报导很多,研究也颇为深入,但真
推进国家治理体系和治理能力现代化被党的十八届三中全会作为全面深化改革的总目标之一。因而,加强国家行政管理主体的公务员,尤其是直接面向群众、影响队伍未来的基层青年公
回忆过去的岁月,有许多经典的营销案例让我们回味,其创意的手段让我们感叹,无论是在营销的某一环节还是整个系统过程,还是具体的策划过程,都有许多值得我们学习和借鉴的地方,
受气候变暖影响而形成露地土壤干旱;因过量施用化学肥料使保护地土壤板结而导致的土壤保水性变差,土壤中有效水含量降低,植物的利用率相对较低,这均在一定程度上造成了干旱胁
近年来,汽车行业快速发展的同时,汽车召回事件也频繁发生,汽车召回往往是因为汽车零部件存在质量问题而影响汽车行驶的安全性,所以对于汽车零部件的质量要求越来越高。对汽车零部