基于CMP集群的并行编程模型的研究与应用

来源 :曲阜师范大学 | 被引量 : 0次 | 上传用户:lilianmm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着对处理器主频以及设计复杂度的进一步要求,单核处理器作为计算和控制的核心已经不能满足处理器的快速发展。为了满足复杂应用的需求,处理器的设计引入了新的架构——CMP (Chip on MultiProcessor)。CMP多核技术已经成为当今处理器的主流应用,因此通过将CMP集群化的方式来构建远胜于单一处理器架构的并行系统的研究也得到很大的发展。CMP集群系统的各方面性能虽有所提高,但是适用于这种集群架构的并行编程模型的研究却相对滞后,因而导致多核架构的性能优势未能充分体现。为了找到一种适合于多核集群系统的编程模型,往往要做大量试验,进行对比、分析以及修正。本文针对这一问题,做了如下研究工作:首先简要介绍多核技术的发展及并行编程模型的研究等基本理论知识。介绍了多核处理器硬件相关的主要实现技术,包括同时多线程(Simultaneous MultiThreading, SMT)、对称多处理器(Symmetrical Multi-Processing)和片上多处理器(Chip-on-MultiProcessor, CMP),详细介绍了CMP多核技术在体系结构方面的知识以及CMP相对单核处理器的优势所在。通过实验验证单机下多核处理器的性能提升与SMP系统相比更具有优势。还介绍了几种常见的并行编程模型的使用范围和优缺点,并通过比较选择出最适合多核集群系统的模型。其次以TBBMPI为主要模型详细描述了适用于CMP集群的并行编程模型,它更加贴近于多核集群体系结构,具有更好的性能体现。在这个基础上,重点研究了这个模型的实现机制,并行化粒度,线程数的确定,以及如何优化编程措施等。通过试验进行性能分析比较,得出在一定条件下,TBBMPI编程模型是最适合于CMP集群的选择。最后描述了一个实际的应用问题并行压缩算法——EZW,并详细介绍了并行应用实现的设计过程和实验比较,以及实验环境的安装配置等。通过对结果的分析,能充分展示上述研究工作的有效性,体现了新型编程模型对性能的提高。多核体系架构的出现促成了多核集群的应用。不论是对于大规模的科研应用还是大型的企业级服务器,多核集群系统都已经成为性价比最高的解决方案,针对这方面的研究也是层出不穷,本文最后对基于CMP集群的编程模型进行了展望,并对下一步要进行的工作做了描述,充分发挥编程模型的并行应用。
其他文献
短道速滑是我国冬季重点项目,其运动员的战术水平在很大程度上影响比赛结果,而在现实战术训练中,由于运动员体力等诸方面的限制无法经常反复的进行演练。短道速滑技战术仿真
在立体视觉领域,遥感图像的立体匹配一直都是一项具有挑战性的课题。由于受到噪声干扰、摄像机镜头畸变、云层遮挡差异以及光线变化等因素的影响,同一物体在立体像对上可能会出
流水车间调度问题属于一类经典的组合优化问题,广泛应用于实际的生产制造之中。其研究内容是在满足一定资源和技术的约束条件下,合理分配相关资源、加工时间以及加工次序,使得要求的性能指标达到较好的结果。传统流水车间调度问题假设机器在工作期间总是可用的,但在实际生产过程中机器会逐渐老化并发生故障。因此,为了将流水车间调度问题的理论成果更好地运用于实际生产中,应考虑机器实际使用中发生故障的情况。本文针对故障情
近年来,随着无线通信技术与传感技术的快速发展,无线传感器网络(WSNs)在各个领域得到越来越多的应用。在实际通信中,无线传感器节点之间存在不可避免的干扰,如何减少节点之间的干
随着Internet的广泛使用以及面向服务的架构(SOA)的出现,电子政务、电子商务和企业门户等应用日益增加,一些商务信息服务只能允许经过授权的用户访问,因此必须采取适当的方式
在早期的互联网时代,分类索引可以有效地帮助用户找到需要的信息。随着互联网数据的不断增加,分类索引难以囊括所有数据,搜索引擎的出现解决了这一瓶颈。在互联网数据爆发的
为了科学发展或者商业用途的需要,社会网络数据获得者们需要将获得的大量社会网络数据进行发布,然而这些数据中含有大量的个人信息,若将这些社会网络数据不加修改地随意发布
目前,随着新亚微米技术的发展,处理器尺寸随之减小,而处理器的性能也进一步得到提高,同时也给处理器的可靠性带来了负面效应。为了提高处理器系统的可靠性,不同级别的故障容错机制
随着计算机网络的普及和网络用户数的迅猛增长,传统的大型服务器很难满足高并发的大量用户的访问需求,而集群技术正是为了解决该问题。由于集群系统所具有的诸多优点,比如很
随着电脑的普及,互联网上的资源已经远远不能满足人类的需求。于是,物联网的发展成为一种潮流。构建物联网的关键条件是实现对资源的寻址,这涉及实体编码规范和资源寻址系统