论文部分内容阅读
云计算、大数据的发展使数据中心规模不断扩展,同时还要求计算、存储、网络等各类资源能够被充分利用,“资源池化”的系统结构设计理念不断被强化。在存储资源方面,新型存储技术的发展使存储器性能有了极大提高,新型存储器件的价格相对昂贵。本文的主要研究目标在于如何对机架内服务器节点的存储资源共享分配,实现一套性能适配、稳定可靠的高速互连网络。本文介绍了新型存储技术,高速互连结构以及资源共享技术的发展现状。然后结合存储-网络融合的新型存储架构,研究了面向机架规模的高速互连网络结构及网络的容错机制。论文的主要工作如下:(1)介绍现有新型存储技术以及高速互连结构的发展,结合数据中心的机架规模架构发展趋势介绍了资源共享技术。(2)设计一套混合层次化的网络结构模型RSI(Rack-Scale Interconnection)。结合机架规模互连需求和节点芯片引脚数量约束条件,通过分析比较显示:在互连规模小于256节点的情况下,RSI-FR(DF)结构相比RSI-BR结构饱和吞吐带宽性能高出约12.8%;在节点规模达到512以上,RSI-FR结构相对其他结构不具备可扩展性,且在1024节点规模下RSI-BR相对RSI-HR、RSI-SR饱和吞吐带宽性能分别高约41%和12.3%;此时,RSI-BR结构可达到310Gbps的远程访问平均吞吐带宽及0.5us的远程平均访问延迟,满足节点对远程新型存储资源访问的带宽和延迟要求。(3)设计适合RSI互连结构的低开销自适应路由机制,通过负载均衡在热点通信出现情况下可将饱和吞吐带宽从86Gbps提高至216Gbps。同时,通过分层化路由表设计减少路由表项,并改进了传统增加虚拟通道(VC)避免死锁的方法,使每个端口需要的VC数量减少为条,降低了硬件开销。(4)设计了一种智能化的路由感知和更新算法,对网络节点路由表进行动态维护,维持故障网络稳定性。测试结果显示:部分节点故障和超级节点故障时不会影响其它正常节点间通信;且部分节点故障时,含故障节点的超级节点平均饱和吞吐带宽性能仅下降约3%;超级节点整体故障时,其它正常超级节点性能几乎不受影响。