论文部分内容阅读
随着云计算技术的快速发展,云平台、云应用已深深地影响着人们的生活方式,与现代生活密不可分。作为云计算的核心基础设施,近年来数据中心已经获得了来自学术界和工业界的广泛关注。在一个数据中心内,数据中心网络作为数据中心的骨干部分,在数据中心的通信、计算和存储三方面起着关键支撑作用。因此,本文主要利用能效优化技术来解决在数据中心网络中的这三方面问题。在通信方面,多播通信是一类重要的通信应用,如可序列化会话/数据同步,大块文件复制,MapReduce分布式计算,操作系统/应用程序升级等,现有方案存在多播树链接冗余的问题;在计算方面,虚拟机的布置直接影响云平台的运行和供给云租户的服务质量,现有方案没有同时考虑虚拟机相关性和租户服务水平协议;在存储方面,冗余流量是一类不可忽略的流量,通过缓存机制可以减少冗余流量对有限带宽的影响,现有方案存在一定的局限性。本文的研究内容主要包括数据中心网络中多播路由机制,虚拟机布置方案和缓存机制三个方面,并在最后通过数据中心网络结构进行了综合分析比较,指出了适宜进行能效优化的结构。主要研究成果包括:1.提出了数据中心网络中高效多播路由机制。利用60 GHz毫米波无线技术,提出了高效多播路由机制NEMO,包括NEMO-Group和NEMO-Cluster两个算法。理论分析了两个算法预期的多播性能改进,估计了无线收益的上下界。实验结果表明,NEMO比现有的数据中心网络多播方案可减少15%-40%的流量,同时提高10%-40%的吞吐量。2.提出了数据中心网络中的优化虚拟机布置方案。同时考虑服务供应商和租户的因素,进行了包括基于相关性的虚拟机布置和基于带宽平衡的虚拟机布置两方面研究。其一,提出了一个基于相关性的虚拟机布置方案,包括资源利用率预测模型和三个基于相关性的虚拟机布置算法。实验结果表明,提出的虚拟机布置算法相较于现有算法提高资源利用率15%-30%,同时满足租户定义的服务水平协议。其二,形式化了基于带宽平衡的虚拟机放置问题,设计了考虑通信局部性的带宽平衡虚拟机的算法,实验结果表明,该算法要优于只考虑通信局部性的贪心算法和只考虑带宽平衡的最长处理时间算法。3.提出了数据中心网络中的高效缓存机制。针对数据中心网络存在的冗余流量,提出了分布式高效缓存机制Piche,包括一个网络协议、节点缓存管理机制、缓存共享机制和缓存布置机制。仿真实验和Amazon EC2平台实验结果表明,Piche适用于不同数据中心结构,具有可扩展性,平均可以减少约40%的冗余流量,同时只增加约10%的运行时间。4.综合分析了数据中心网络结构,以更好地实施能效优化。根据近十年的文献,全面整理分析了数据中心网络拓扑设计和架构,包括连接类型、线路布局、互连设备、网络特性等方面。对数据中心网络中通信、计算和存储三方面涉及的指标进行了定性和定量分析,包括可扩展性、总体开销、能源有效性、对分带宽和网络直径等,指明了适合进行能效优化的结构。最后还讨论了配置无线天线和光学设备的结构。