论文部分内容阅读
[目的]为了加快国产CFD软件的计算速度,本文设计并实现了基于国产加速器的加速版本.[方法]基于CCFD V3.0版本,将软件的核心算法移植到国产加速器,并采用多种方法进行优化.[结果]使用128*128*128大小的网格进行实验,移植后的程序模拟结果与原CPU版本基本一致,单加速卡相比于单CPU核心,对流项计算部分取得了 166倍的加速,ADI迭代计算部分取得了59倍的加速.[局限]由于CFD软件模块较多,未对整个程序进行移植优化,未来会将软件都移植到国产加速器上进行加速.[结论]本文实现了基于国产加速器的CFD核心算法并行优化,取得了较好的加速效果,为以后CFD软件的移植与优化工作提供了经验和参考.