基于异构系统的流固耦合模拟并行算法的研究与实现

来源 :湖南大学 | 被引量 : 0次 | 上传用户:hongjiansu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在过去10年中,计算机技术和集成电路技术依旧发展迅猛。GPU已经发展成一种专门面向计算密集型的CPU协处理器,服务于大规模和高并行化的计算应用。在由CPU和GPU构建的异构系统架构中,CPU和GPU的协同并行计算已成为高性能计算的研究热点,主要涉及到该系统架构能够根据计算任务的特点将计算资源合理分配给CPU和GPU,从而提高计算资源的利用率,以低开销实现高计算性能。本文对流固耦合问题数值模拟的CPU-GPU和CPU-MIC并行算法进行了探索。格子玻尔兹曼法(Lattice-Boltzmann method,LBM)是对复杂流场进行数值模拟的主要方法,浸入边界法(Immersed Boundary method,IBM)则是对固体结构沉浸在流场中微观作用情况进行处理的方式之一。LBM将流体抽象成大量的微观粒子,并在网格上进行迁移和碰撞,反应微粒分布的统计函数进行时空演化得到流场宏观变量,而IBM将固体边界对流场的影响转化成体积力的形式让流场感知。用IB-LBM(Immersed Boundary-Lattice-Boltzmann method)对不可压缩流体的流固耦合问题进行模拟计算和分析。但是IB-LBM属于计算密集型应用,当模拟的规模增大时,对计算性能的要求迅速提高。为此,文章采用 CUDA(Computer Unified Device Architecture)编程框架,设计了基于异构系统的IB-LBM模拟流固耦合的并行算法。首先,采用D2Q9的LBM格子模型,结合IBM对有固体浸入的流场完成数值框架的建立,将测试数据与已有数据进行对比验证。通过给定处理器粗细粒度分布方式,描述了更新LBM和修正IBM的并行算法,提出了三种数.据结构对算法性能进行优化。其次,将IB-LBM并行算法在CPU-GPU和CPU-MIC两种异构并行系统进行实现,并且设计出针对这两种异构系统的新的计算资源分配策略,对算法性能进一步优化。最后,使用MFLUPS理想标准值对三种数据结构、线程数扩展性、两种体积分数以及不同网格大小等方面对性能的影响进行了分析和评估。
其他文献
班杜拉社会学习理论是以"观察学习"为核心而建立的,其强调了榜样的示范在个体道德塑型中的作用,对现代德育工作有着重要的启迪和应用价值。本文从家庭、学校、社会三个方面谈
随着现代社会对交通运输的日趋依赖,交通系统的控制越来越受到普遍的重视。而采用先进的信息技术、通信技术和控制技术等高新技术开发的智能交通系统可以大幅度提高交通网络
为进一步优化等离子体射流点火器的结构,提高点火器的工作性能,在自主设计的等离子体点火实验系统的基础上,开展了阳极通道长度对等离子体射流点火器特性影响的实验研究,选取
目的制备纳米氧化锌并考察其紫外吸收特性。方法以硝酸锌、尿素为原料,采用均匀沉淀法制备氧化锌前驱体[Zn(OH)2],通过煅烧制备纳米氧化锌。结果制备出的纳米氧化锌粒径在20~4
"军委管总、战区主战、军种主建"是伟大改革的纲领,是理念原则也是宏伟蓝图。"军委管总"表征了我军统帅机构新的权力形态,是落实宪法规定的"军委主席负责制"的重大战略举措,
学分制作为一种教学管理制度,最初只在大学实行,以更好适应学生个性发展的需要。后来开始下沿至中学教育实践,并引发了广泛的争议与探讨。在我国历史上,民国二三十年代教育界
目的探讨精心护理模式对腰椎间盘突出合并糖尿病患者的应用价值。方法选取我院2014年1月~10月收治的腰椎间盘突出症合并糖尿病患者66例作为研究对象,随机的分为研究组和对照
近年来,高校毕业生就业情况逐渐成为社会讨论的热点问题。一方面,逐年上升的毕业总人数使得学生之间的就业竞争压力不断增大;另一方面,企业对人才质量的要求不断提高导致就业门槛不断提高。这两方面的因素导致毕业生与招聘方的交互难度不断提升。就业推荐系统可以搭建毕业生与企业需求之间的桥梁,这是缓解学生就业问题的有效方法。现有的学生就业推荐系统中仍然存在以下问题:(1)采取范围性推荐,无法针对个体实现精准推荐;
交叉口是构成城市道路交通网络的基本元素。车辆在交叉口处的分流、合流以及交叉行为使其成为制约道路网络通行能力的主要瓶颈。信号控制是交叉口常用的一种交通管理与控制方