论文部分内容阅读
随着科学技术的快速发展,越来越多的企业或单位开始利用虚拟机搭建数据中心来应对日益增长的计算需求。然而,随着数据中心虚拟机数目的不断增加,单个虚拟机发生故障从而导致整个数据中心失效的概率也随之增加。目前,虚拟机保护技术主要包括虚拟机迁移和虚拟机备份,它们都是迁移或备份完整的虚拟磁盘文件,这会消耗大量的存储资源和网络带宽。因此,提高存储资源的利用率,是虚拟机保护技术中必须解决的一个重要问题。重复数据删除技术是一种新型的数据缩减技术,它能够消除相同数据内容的文件、数据块或字节,只保存它们的一个副本。因此,采用基于数据段相似性的重复数据删除解决方案消除虚拟磁盘文件之间的重复数据,不仅可以降低虚拟磁盘文件的存储空间,而且能够减少虚拟机的备份窗口。针对重复数据删除技术的读性能下降和指纹匹配问题,分别采用VmStore和HashDB技术。VmStore遵循相邻数据相邻存储的原则,可以有效缓解重复数据删除所带来的读性能问题。HashDB基于数据段的相似性原理,不仅可以提高指纹匹配效率,而且能够节约内存空间。对包含有多种虚拟磁盘文件的数据集进行了详细测试。测试结果表明,变长分块算法适用于不同虚拟平台下的虚拟磁盘文件,同一虚拟平台下的不同虚拟磁盘文件之间宜采用固定长分块算法,基于数据段相似性的重复数据删除解决方案可以有效地挖掘出重复数据,并且通过采用HashDB和VmStore技术极大地改善了指纹匹配问题和读性能问题。