1D3V粒子模拟软件BUMBLEBEE的多核TBB并行研究

来源 :电子科技大学 | 被引量 : 3次 | 上传用户:peter_wan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当我们遇到某些复杂问题的时候,传统的数学建模或者实验技术不一定能解决,比如大尺度的自然现象、瞬态的物理过程、一些具有复杂边界的问题等。随着计算机的高速发展,人们开始通过计算机来解决这样的问题,且取得了显著的成绩,但是随着模型增大或问题的精细化,使得计算机模拟负担呈数量级的增长,因此提高计算效率非常关键。通过硅工艺来提高CPU的频率已经达到了瓶颈,想要通过提高CPU频率来增加运算速度显然很困难,因此人们瞄向了多核并行。Intel公司的多核处理器已经日趋成熟,还发明了应用于多核编程的TBB线程构建模块,通过线程构建模块,将大大提高某些程序的运行效率。1D3V粒子模拟软件BUMBLEBEE是一款描述激光和物质互作用的粒子模拟软件。由于它的运行时间长,且又是一款适合并行的软件,因此本文基于因特尔公司的TBB线程构建模块,将1D3V粒子模拟软件BUMBLEBEE的串行程序并行化,主要工作包括:1.对TBB产生的背景及其并行环境Intel Parallel Studio做了简单的介绍,通过对比其他的编程语言如MPI和Open MP,阐述了选择TBB线程构建模块的原因。2.对串行代码的数据结构做了介绍,包括各个模块的功能和模块之间的执行顺序,然后通过Intel Parallel Studio中自带的工具对串行代码的热点做了分析。3.对本文中需要用到的TBB模板做了详细介绍,包括循环并行模板parallel_for和任务调度器task模板,对TBB中的其他功能作了简要的介绍。4.详细的描述了并行的具体步骤,对并行过程中遇到的数据竞争问题做了分析,详细的描述了解决数据竞争的算法及其原理,展示了并行程序相对于串行程序的加速比以及并行程序的可扩展性,其中加速比在四核下接近于线性加速,可扩展性良好。5.对比了并行程序和串行程序的运行结果(运行结果包括场的变化、粒子位置的变化等),最终结果完全一致,验证了并行程序的正确性。最后分析了运行结果随时间的变化过程。
其他文献
滤波器是高集成度RF收发机中的重要电路,低功耗、高线性度是片上集成有源滤波器的设计重点。本文针对中高速无线传感器网络节点RF前端的应用要求,以七阶椭圆无源滤波器为原型
"纯真之眼"是英国19世纪美术批评家拉斯金提出的一个概念,它指的是不带任何先人之见地观看艺术作品,就像完全不懂事的小孩子一样,强调了视觉真实。而在《艺术与错觉》中,E.H.
熔石英光学元件广泛应用于各类光学系统,在高功率固体激光装置中其表面损伤问题尤为突出,熔石英元件一旦损伤将导致损伤阈值降低并导致下游元件损伤,因此工程上采用CO2激光对
激光与物质间的相互作用研究在材料加工、机械制造业、光电成像系统等有着重要意义。而关于光学增透薄膜与重复频率激光的相互作用研究尤为重要,本文主要对重复频率长脉冲激
为缩短光电成像设备的研发周期,使用转台模拟载机的飞行速高比信息进行光电侦察设备的性能测试。论文以光电成像设备性能测试转台伺服控制为内容开展研究工作。在查阅国内外
目的:通过对临床资料的研究,总结对神经外科重症监护患者肺部感染实施全面的针对性护理可以提高护理质量。方法:随机抽取60例我院近两年发生肺部感染的患者进行回顾性分析。
中国漆艺文化历史久远,博大精深。漆艺文化是人类非物质文化遗产重要门类之一。本文从"大漆"的由来、"漆"字的演变,及中国漆艺文化的经典-《髹饰录》等多方面揭示了大漆二字蕴含
转录组(Transcriptome)是指特定细胞或组织中全部转录产物,包括信使RNA,核糖体RNA、转运RNA以及非编码RNA。高通量测序技术的快速发展,为从整体水平系统地研究转录组学研究提
近10年来,随着我国经济高速增长,我国汽车市场迎来了高速发展的时期,汽车保有量不断攀升,我国连续多年成为全球第一大汽车市场。汽车市场的发展也带动了机动车辆保险市场的繁
目的探讨PL-11血小板分析仪在检测血小板数量及聚集功能方面的性能。方法按照美国临床实验室标准化协会(CLSI)制定的仪器性能验证标准及我国卫生行业标准WS/T 406-2012《临床