并行自适应结构网格计算中的逐层投影负载平衡算法

来源 :2008年全国高性能计算机学术年会 | 被引量 : 0次 | 上传用户:fan20090603
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在并行自适应结构网格计算中,多个嵌套的网格层同时需要负载均衡。为了减少层间数据通信,本文设计了一种基于逐层投影的负载平衡算法。该算法包括逐层投影和逐层剖分阶段。第一个阶段将加密区域的父子网格投影到一起,第二个阶段逐层多约束剖分各层网格。数值实验表明,本算法在减小层间通信和数据迁移方面有较好的效果。
其他文献
缓存已经被广泛用于填补高速的处理器和相对较慢的主存之间的鸿沟。然而,缓存本身的动态和自适应的特性使得它成了程序运行不可预知的源头。于是,缓存管理在实时系统的设计中显得很重要。运行于嵌入式处理器上的软件的最坏执行时间是实时系统的设计中需要考虑的一个重要标准。在实时系统中管理缓存的一种可行方案是将缓存内容静态锁定,使得主存访问的时间和与缓存相关的抢占时间变得可预期,从而可精准的评估最坏执行时间。本文探
高性能计算的发展对互连网络拓扑提出了更高的要求,网络拓扑结构的探索研究始终是高性能计算领域的一个重要课题。本文介绍了近年来出现的几种网络拓扑,它们尚未得到广泛应用,但已因各自在某些方面的突出优势值得关注。
CPU/FPGA混合架构是可重构计算的普遍结构,为了简化混合架构上FPGA的使用,本文提出了一个该架构上的硬件线程方法,并设计了该架构上的硬件线程执行机制,以硬件线程的方式使用可重构资源。同时,软硬件线程可以通过共享数据存储方式进行多线程并行执行,将程序中运算量较大的部分由FPGA上的硬件线程执行,而控制部分交给CPU上的软件线程执行。Simics仿真软件被用来模拟了一个软硬件混合的实验平台,软硬
随着片上多核结构成为当前高性能微处理器发展的趋势,对片内网络拓扑结构和一致性模型进行建模和评估成为模拟器研究的重点。本文分析了国际上被学术界和工业界广泛采用的GEMS系统的访存模块,并通过实验对一种CMP结构进行了有效的分析和评估。
大规模机群因其良好的易构建性和可扩展性,已广泛应用于科学计算和商业应用中。通过分析大规模机群系统中的日志,可以预测失效、侦测失效、定位故障根源,提高系统和应用的可靠性和可用性。本文提出了一种基于图挖掘的多维失效分析方法来分析多源的系统日志,以获得更加完整和 准确的失效知识。通过曙光4000A高性能计算机系统中系统日志的多维失效分析,实验结果证明了这种方法的有效性。
随着超级计算机系统规模的不断扩大以及系统结构的日益复杂,硬件可靠性和软件可用性都面临着严峻的威胁和挑战,系统高可用性已成为研制超大规模并行计算机系统必须解决的一项关键性技术。本文分析了超级计算机容错设计的思想、硬件可用性设计支持、系统级容错模型以及主要软件容错措施,并进行了总结。
EMAN是当今使用最广泛的单颗粒重构软件之一,然而其处理过程及其耗时。针对这一问题,本文详细阐述了EMAN单颗粒重构中最耗时的模型优化部分所采用的算法,结合算法不同部分的特点,设计了相应的优化与并行加速策略。在曙光4000高性能计算机上的试验结果表明,经过优化和并行化的程序能够获得较高的性能和较好的加速比。
当前大多数并行作业调度算法研究是针对严格作业进行的,但空间共享模式下的并行作业调度受制于资源碎片问题而在响应时间和系统利用率等方面有所不足。本文提出了基于可塑作业模型的MB-FCFS算法。该算法以传统的结合回填FCFS算法为基础,通过调度时对作业平均响应时间的预测来从用户提供的多项资源请求选项中选择适合的作业请求规模,并利用遗传算法来解决最优作业资源请求的搜索问题。模拟器上实际作业流的模拟结果表明
本文测试并分析了高性能预条件库HYPRE的多重网格解法器SMG和BoomerAMG在某国产大规模并行机的数千个处理器上的可扩展性能,得到若干对线性解法器算法研究和并行实现 技术发展具有启示性意义的结论。这些结论对实际复杂物理系统数值模拟中线性解法器的应用和发展具有一定的指导意义。
连接查询操作是主存数据库中一种较为重要的查询操作。随着计算机芯片技术的发展,中央处理器和内存速度之间的差距越来越大,极大地影响了连接算法的性能。本文通过高速缓存优化技术,提出了一种基于缓冲的高速缓存参数无关的嵌套循环并行连接算法。分析以及实验结果表明,高速缓存优化后的串行连接算法的性能是原来的2倍,其并行算法效果近似线形加速比。