曙光5000高效能计算机系统的互连网络研究

来源 :中国科学院计算技术研究所 | 被引量 : 0次 | 上传用户：lpy2009

【摘要】

：

研制具有千万亿次计算能力的并行计算机系统是当前的重大挑战之一。曙光5000高效能计算机系统是中国科学院计算技术研究所国家智能计算机中心开发的面向千万亿次计算的超级计

【作者】

：

曹政

【机构】

：

中国科学院计算技术研究所

【出处】

：

中国科学院计算技术研究所

【发表日期】

：

2009年期

【关键词】

：

互连网络交叉开关交换芯片多轨网络集合通信多播通信大规模网络模拟

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

研制具有千万亿次计算能力的并行计算机系统是当前的重大挑战之一。曙光5000高效能计算机系统是中国科学院计算技术研究所国家智能计算机中心开发的面向千万亿次计算的超级计算机。曙光5000互连网络是为曙光5000系统设计的可扩展高性能网络，实现结点间的高速互连。　　在千万亿次规模的系统中，互连网络设计面临新的挑战。高性能结点和大规模是构建千万亿次系统的主要技术趋势，不断提高的结点计算能力要求互连网络提供更高的性能，而不断增大的规模又对互连网络扩展性提出了更高的要求。此外，随着系统规模的增大，集合通信的执行时间也在不断增长，制约了应用的扩展性，集合通信的性能需要得到进一步的优化。除性能之外，可靠性问题也随着系统规模的扩大而日益严重。　　针对上述问题，本文从互连网络体系结构、网络接口控制器设计、交换机结构设计和集合通信性能优化等几个方面，对互连网络设计方法进行研究，提出了曙光5000高性能互连网络的设计。曙光5000互连网络采用多轨网络设计，在一定程度上打破了工艺对网络带宽的限制，并提高短消息的消息率。多轨网络的单层网络采用胖树拓扑，虚切入交换、源址路由和基于绝对信用的流控，以满足互连网络在性能和扩展性上的需要。为满足互连网络可管理性的需要，曙光5000互连网络设置了带外管理网络，对数据网络进行监控管理，实现对故障的及时诊断和恢复。此外，本文从性能、可实现性和扩展性三方面对曙光5000网络接口控制器和曙光5000交换芯片的设计进行了研究。　　为实现集合通信性能优化，曙光5000互连网络提供了嵌入Barrier和多播网络支持。曙光5000嵌入Barrier网络充分利用胖树拓扑的特点，以交换机为根实现Barrier树形算法，并提供链路点对点可靠性支持，相比于现有Barrier通信机制，可以获得更低的Barrier延迟和更好的扩展性。嵌入多播网络则重点解决多播死锁和多播路径选择问题，本文提出的HLSE多播路径选择算法，可以充分的利用胖树中的负载较轻的路径，测试结果表明，相比于已有的负载均衡路径选择算法，可以获得三倍的性能提升。　　基于上述设计，本文实现了曙光5000互连网络原型系统。曙光5000交换芯片首先基于FPGA进行逻辑功能验证，在功能验证正确的基础上，进行了ASIC实现。曙光5000交换芯片集成了20M晶体管，共1053个管脚(其中690个I/O管脚)，采用Flipchip封装，工作频率为156.25MHZ。测试结果表明曙光5000互连网络原型系统实现了较高的性能，其最低通信延迟为1.73us，通信带宽为634.69MByte/s(为最高有效数据带宽的99.17％)。　　为进一步验证曙光5000互连网络设计的可扩展性，本文开发了超大规模互连网络模拟器HPPNetSim，对超大规模下的曙光5000互连网络的性能进行预测。HPPNetSim的模拟结果表明，当扩展至上万结点规模后，在均匀随机分布的通信模式下，曙光5000互连网络仍能获得67％的单播吞吐率，相比1024结点规模仅有5.6％的性能下降，具有较好的扩展性。

其他文献

无线传感器网络安全定位及应用的研究

无线传感器网络由于其广阔的应用前景，已成为近年来的研究热点之一。在无线传感器网络中，传感器节点的位置信息十分重要。这是因为传感器节点收集的数据一般需要与其位置进行绑

学位

污染攻击虫洞攻击检测无线传感器网络安全定位

隐含因果关联规则挖掘的研究

关联规则是数据挖掘领域最为成熟的研究内容之一，也是基于数据库的知识发现中知识的主要表示形式。但一般关联规则仅限于体现事物间的关联关系，是一种弱关系，在实际应用中往往不

学位

因果关系关联规则约束网络广义细胞自动机数据挖掘知识发现

基于“软件人”群的分布式入侵检测系统研究

随着入侵检测技术的不断进步，入侵检测系统(IDS)愈来愈呈现出分布性、智能化的特征。传统的分布式入侵检测系统，往往仅采取一种分布式数据采集和层次化数据分析的方法。这虽然

学位

分布式入侵检测软件人群网络通信负荷IDS功能模块结构模型

基于SaaS的内容管理系统访问控制的研究

内容管理系统常用于企业信息化建设和电子政务，利用内容管理系统可以协助企业和组织实现其内容的创建、存储、应用和更新。内容管理系统中对象资源客体可以是任何类型的数字信

学位

内容管理系统访问控制企业信息化软件即服务模式EB-RBAC模型

位置隐私保护技术研究

随着无线通信和移动定位技术的发展，基于位置的服务成为一种流行趋势，受到学术界和工业界的广泛关注。位置服务是与用户当前位置相关的增值服务，包括基于位置的紧急救援服务、基

学位

无线通信位置服务信息管理隐私保护控制技术

基于视觉的数据密集型网页信息抽取

随着Internet的飞速发展，特别是Deep Web（暗网）的发展，Web信息资源越来越丰富。网上出现了大量数据质量较高、领域性较强的信息，但是能够快速、准确地获取这些信息的途径却比较有

学位

数据密集型网页视觉信息信息抽取技术工作原理检索系统

基于地址池和地址队列的快速层次型移动IPv6优化方案

随着因特网和无线通信技术的发展，越来越多的移动设备需要接入因特网。为了支持移动设备接入因特网的需求，IETF制定了移动IPv6以提供移动数据解决方案。但是移动IPv6存在切换延

学位

地址重复检测乒乓运动地址池地址队列

基于时态约束关联规则挖掘方法的研究

数据挖掘的概念自产生之初，就受到了研究学者们的广泛关注。经过几十年的发展，许许多多的新概念、新方法被人们探索出来，并得到传承和改进。特别是最近几年，一些基本概念和基本方

学位

数据挖掘关联规则时态约束ISS-TM算法项目集格空间

商业银行个人信用风险管理系统研究

近年来，个人消费信贷蓬勃发展，商业银行的个人信贷业务所面临的信用风险逐渐成为影响商业银行最重要的风险。在我国的信用基础以及信用评估技术还相对薄弱的情况下，借鉴国外的信

学位

个人信用风险信用评估模型信用风险度量模型C/S系统商业银行风险管理系统Logistic回归

多关系数据流挖掘算法与应用研究

本文的课题背景为国家自然科学基金“多关系频繁模式挖掘模型、方法库的知识发现机理、模型与算法研究”(项目批准号：60875029)。　　多关系数据流环境，是一种现实存在而又复

学位

多关系数据流挖掘复杂数据环境周期采样蛋白质二级结构复合金字塔模型

曙光5000高效能计算机系统的互连网络研究

与本文相关的学术论文