论文部分内容阅读
为了提高计算流体领域中复杂流动现象模拟计算的高效性和准确性,充分利用GPU的高峰值浮点计算性能和高存储器带宽,提出一种基于CUDA 架构的immersed boundary – lattice Boltzmann method (IB-LBM)的模拟算法.借助GPU 高度并行化,多线程特性,为每个网格分配一个线程,使多条线程并行 计算.在合理利用CUDA 存储层次架构中常量内存和纹理内存的同时,恰当使用共享存储器和寄存器规 避全局存储器的不接合访问及较长延迟.针对GPU 采用多种优化策略的同时遵循IB-LBM 模型的相应规 则实现模拟计算.实验结果表明,在NVIDIA GeForce 9800 GT 显卡和Intel.Core.2 CPU 6300 组成的 平台下,GPU 下实现速度提高到CPU的90 倍左右.