基于多层树形结构的并行机资源管理与分配

来源 :2008年全国高性能计算机学术年会 | 被引量 : 0次 | 上传用户:zcllq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
并行计算机的规模不断扩大,计算资源的有效管理和高效利用成为大规模并行计算机设计的关键点之一。传统的资源管理系统在计算节点数量巨大时容易出现管理瓶颈,资源管理的性能和实时性大大降低。本文提出了基于多层树形结构的资源管理模型,从理论上分析了其高可扩展性。基于该模型对资源的细粒度管理和分配进行了探讨。通过分析和性能模拟,得出多层结构资源管理模型具有良好的可扩展性、监测的高实时性以及优良的软件性能。
其他文献
大规模机群因其良好的易构建性和可扩展性,已广泛应用于科学计算和商业应用中。通过分析大规模机群系统中的日志,可以预测失效、侦测失效、定位故障根源,提高系统和应用的可靠性和可用性。本文提出了一种基于图挖掘的多维失效分析方法来分析多源的系统日志,以获得更加完整和 准确的失效知识。通过曙光4000A高性能计算机系统中系统日志的多维失效分析,实验结果证明了这种方法的有效性。
随着超级计算机系统规模的不断扩大以及系统结构的日益复杂,硬件可靠性和软件可用性都面临着严峻的威胁和挑战,系统高可用性已成为研制超大规模并行计算机系统必须解决的一项关键性技术。本文分析了超级计算机容错设计的思想、硬件可用性设计支持、系统级容错模型以及主要软件容错措施,并进行了总结。
EMAN是当今使用最广泛的单颗粒重构软件之一,然而其处理过程及其耗时。针对这一问题,本文详细阐述了EMAN单颗粒重构中最耗时的模型优化部分所采用的算法,结合算法不同部分的特点,设计了相应的优化与并行加速策略。在曙光4000高性能计算机上的试验结果表明,经过优化和并行化的程序能够获得较高的性能和较好的加速比。
当前大多数并行作业调度算法研究是针对严格作业进行的,但空间共享模式下的并行作业调度受制于资源碎片问题而在响应时间和系统利用率等方面有所不足。本文提出了基于可塑作业模型的MB-FCFS算法。该算法以传统的结合回填FCFS算法为基础,通过调度时对作业平均响应时间的预测来从用户提供的多项资源请求选项中选择适合的作业请求规模,并利用遗传算法来解决最优作业资源请求的搜索问题。模拟器上实际作业流的模拟结果表明
本文测试并分析了高性能预条件库HYPRE的多重网格解法器SMG和BoomerAMG在某国产大规模并行机的数千个处理器上的可扩展性能,得到若干对线性解法器算法研究和并行实现 技术发展具有启示性意义的结论。这些结论对实际复杂物理系统数值模拟中线性解法器的应用和发展具有一定的指导意义。
连接查询操作是主存数据库中一种较为重要的查询操作。随着计算机芯片技术的发展,中央处理器和内存速度之间的差距越来越大,极大地影响了连接算法的性能。本文通过高速缓存优化技术,提出了一种基于缓冲的高速缓存参数无关的嵌套循环并行连接算法。分析以及实验结果表明,高速缓存优化后的串行连接算法的性能是原来的2倍,其并行算法效果近似线形加速比。
在并行自适应结构网格计算中,多个嵌套的网格层同时需要负载均衡。为了减少层间数据通信,本文设计了一种基于逐层投影的负载平衡算法。该算法包括逐层投影和逐层剖分阶段。第一个阶段将加密区域的父子网格投影到一起,第二个阶段逐层多约束剖分各层网格。数值实验表明,本算法在减小层间通信和数据迁移方面有较好的效果。
本文针对机群商业应用存在负载随机变化及实时性要求高的特点,提出了基于备用实例的机群应用管理机制;设计了基于备用实例的机群应用管理架构,并给出了备用实例状态及转换条件的定义。实验证明,与既有启/停新的应用实例机制比较,基于备用实例的机群应用管理机制降低了应用重起时间开销,并在负载增加的情况下,提高应用性能,有效提高应用的短期过载能力和负载波动的自适应能力。
SAS统计软件在数据分析和统计分析领域获得了广泛应用,但是在某些模块的计算上,需要花费较长的时间才能得到较为精确的结果。随着双核成为计算机的主流,四核甚至多核CPU系统逐渐走向成熟,个人的桌面电脑采用并行技术进行计算和事务处理成为现实将为期不远。本文利用MPI对SAS的NPAR1WAY模块精确求P值计算方法进行并行化处理,实验表明并行效率良好。由此可见,并行编程对于优化SAS中这类耗时的计算模块问
集群系统的编程性、管理性以及节点利 用率通常不能令用户满意。本文阐述的原型系统 尝试用整合的方式解决这些问题,通过提供共享的地址空间简化编程以及管理的难度,通过结合虚拟化技术,提高机群节点的利用率。本文将SVM的方法在虚拟化环境下进行了延伸并结合虚拟化技术,为客户操作系统提供共享的客户物理地址空间。通过将现有单机运行的VMM(Xen)扩展,使其可以为在商业化的机群上提供一个或多个紧耦合(类似NUM