曙光5000高效能计算机系统的互连网络研究

来源 :中国科学院计算技术研究所 | 被引量 : 0次 | 上传用户:lpy2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
研制具有千万亿次计算能力的并行计算机系统是当前的重大挑战之一。曙光5000高效能计算机系统是中国科学院计算技术研究所国家智能计算机中心开发的面向千万亿次计算的超级计算机。曙光5000互连网络是为曙光5000系统设计的可扩展高性能网络,实现结点间的高速互连。   在千万亿次规模的系统中,互连网络设计面临新的挑战。高性能结点和大规模是构建千万亿次系统的主要技术趋势,不断提高的结点计算能力要求互连网络提供更高的性能,而不断增大的规模又对互连网络扩展性提出了更高的要求。此外,随着系统规模的增大,集合通信的执行时间也在不断增长,制约了应用的扩展性,集合通信的性能需要得到进一步的优化。除性能之外,可靠性问题也随着系统规模的扩大而日益严重。   针对上述问题,本文从互连网络体系结构、网络接口控制器设计、交换机结构设计和集合通信性能优化等几个方面,对互连网络设计方法进行研究,提出了曙光5000高性能互连网络的设计。曙光5000互连网络采用多轨网络设计,在一定程度上打破了工艺对网络带宽的限制,并提高短消息的消息率。多轨网络的单层网络采用胖树拓扑,虚切入交换、源址路由和基于绝对信用的流控,以满足互连网络在性能和扩展性上的需要。为满足互连网络可管理性的需要,曙光5000互连网络设置了带外管理网络,对数据网络进行监控管理,实现对故障的及时诊断和恢复。此外,本文从性能、可实现性和扩展性三方面对曙光5000网络接口控制器和曙光5000交换芯片的设计进行了研究。   为实现集合通信性能优化,曙光5000互连网络提供了嵌入Barrier和多播网络支持。曙光5000嵌入Barrier网络充分利用胖树拓扑的特点,以交换机为根实现Barrier树形算法,并提供链路点对点可靠性支持,相比于现有Barrier通信机制,可以获得更低的Barrier延迟和更好的扩展性。嵌入多播网络则重点解决多播死锁和多播路径选择问题,本文提出的HLSE多播路径选择算法,可以充分的利用胖树中的负载较轻的路径,测试结果表明,相比于已有的负载均衡路径选择算法,可以获得三倍的性能提升。   基于上述设计,本文实现了曙光5000互连网络原型系统。曙光5000交换芯片首先基于FPGA进行逻辑功能验证,在功能验证正确的基础上,进行了ASIC实现。曙光5000交换芯片集成了20M晶体管,共1053个管脚(其中690个I/O管脚),采用Flipchip封装,工作频率为156.25MHZ。测试结果表明曙光5000互连网络原型系统实现了较高的性能,其最低通信延迟为1.73us,通信带宽为634.69MByte/s(为最高有效数据带宽的99.17%)。   为进一步验证曙光5000互连网络设计的可扩展性,本文开发了超大规模互连网络模拟器HPPNetSim,对超大规模下的曙光5000互连网络的性能进行预测。HPPNetSim的模拟结果表明,当扩展至上万结点规模后,在均匀随机分布的通信模式下,曙光5000互连网络仍能获得67%的单播吞吐率,相比1024结点规模仅有5.6%的性能下降,具有较好的扩展性。
其他文献
无线传感器网络由于其广阔的应用前景,已成为近年来的研究热点之一。在无线传感器网络中,传感器节点的位置信息十分重要。这是因为传感器节点收集的数据一般需要与其位置进行绑
关联规则是数据挖掘领域最为成熟的研究内容之一,也是基于数据库的知识发现中知识的主要表示形式。但一般关联规则仅限于体现事物间的关联关系,是一种弱关系,在实际应用中往往不
随着入侵检测技术的不断进步,入侵检测系统(IDS)愈来愈呈现出分布性、智能化的特征。传统的分布式入侵检测系统,往往仅采取一种分布式数据采集和层次化数据分析的方法。这虽然
内容管理系统常用于企业信息化建设和电子政务,利用内容管理系统可以协助企业和组织实现其内容的创建、存储、应用和更新。内容管理系统中对象资源客体可以是任何类型的数字信
随着无线通信和移动定位技术的发展,基于位置的服务成为一种流行趋势,受到学术界和工业界的广泛关注。位置服务是与用户当前位置相关的增值服务,包括基于位置的紧急救援服务、基
随着Internet的飞速发展,特别是Deep Web(暗网)的发展,Web信息资源越来越丰富。网上出现了大量数据质量较高、领域性较强的信息,但是能够快速、准确地获取这些信息的途径却比较有
随着因特网和无线通信技术的发展,越来越多的移动设备需要接入因特网。为了支持移动设备接入因特网的需求,IETF制定了移动IPv6以提供移动数据解决方案。但是移动IPv6存在切换延
数据挖掘的概念自产生之初,就受到了研究学者们的广泛关注。经过几十年的发展,许许多多的新概念、新方法被人们探索出来,并得到传承和改进。特别是最近几年,一些基本概念和基本方
近年来,个人消费信贷蓬勃发展,商业银行的个人信贷业务所面临的信用风险逐渐成为影响商业银行最重要的风险。在我国的信用基础以及信用评估技术还相对薄弱的情况下,借鉴国外的信
本文的课题背景为国家自然科学基金“多关系频繁模式挖掘模型、方法库的知识发现机理、模型与算法研究”(项目批准号:60875029)。   多关系数据流环境,是一种现实存在而又复