数据备份系统中有关数据碎片的研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户：yangmu2003

【摘要】

：

随着信息时代的来临,数据呈现爆炸式地增长,数据备份系统需要存储的备份数据越来越多,为了节省存储资源,重复数据删除技术作为一种无损数据压缩技术被广泛应用于数据备份系统

【作者】

：

文舰

【出处】

：

重庆大学

【发表日期】

：

2004年期

【关键词】

：

数据备份系统重复数据删除技术数据碎片恢复性能碎片解决方案

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着信息时代的来临,数据呈现爆炸式地增长,数据备份系统需要存储的备份数据越来越多,为了节省存储资源,重复数据删除技术作为一种无损数据压缩技术被广泛应用于数据备份系统中。重复数据删除技术的基本原理是删除重复的数据,对内容重复的数据单位只存储一份,以达到大幅度压缩数据量的目的。但是由于使用重复数据删除技术删除了重复数据,使得备份数据流中逻辑上连续的数据块在物理存储空间上不连续,导致数据恢复时产生大量的磁盘随机读操作,严重降低了数据备份系统的恢复性能。这些在逻辑空间上连续但在物理存储空间上不连续的数据块被称为数据碎片。目前,学术界已出现了多种碎片解决方案,包括帽子算法(Capping)、基于上下文的重写算法(CBR)、历史感知的重写算法(HAR)和面向主存储系统的重删算法(iDedup)。它们解决数据碎片的主要思想是改变数据块在磁盘上的布局,通过重写适量的碎片数据,使大部分逻辑空间上连续的数据块在物理存储空间上也连续,从而减少系统中数据碎片的数量。以牺牲少量存储空间为代价,换取恢复性能的提升。然而通过理论分析和实验验证,我们发现现有的碎片解决方案不能精确的识别数据碎片。其中Capping、CBR和HAR方案,因为使用固定大小的容器作为碎片识别的基本单位,只关注容器中有效数据块的总量,不考虑每个有效数据块的具体存储地址,导致不能精确识别数据碎片,重写过多的数据,且恢复性能得不到有效的提升。而iDedup虽然使用了变长容器作为碎片识别的基本单位,解决了固定大小的容器存在的问题,但是它没有考虑对恢复性能起着很大作用的磁盘特性,i Dedup在数据恢复时一次读磁盘操作往往只能读取较少数据,使得该碎片解决方案也不能精确识别数据碎片。针对现有碎片解决方案存在的问题,我们提出了一种更加精确的碎片解决方案AEDefrag。该方案以大小可变的数据组为碎片识别单位,其基本思想是计算恢复或读取一个数据组时的有效数据传输带宽,若有效数据传输带宽低于用户所期望的带宽,则该数据组内的有效数据被认定为数据碎片,反之该数据组内的有效数据不是数据碎片。通过实验测试,AEDefrag比现有的碎片解决方案重删率提高了1%到9%,恢复性能比Capping提升高达102%,比CBR提升高达54%,比HAR提升高达175%,比iDedup提升高达263%。

其他文献

Linux内核级多进程任务容错技术研究

随着计算机芯片的工作电压的降低,工作频率的提高,芯片瞬时故障概率越来越大,在某些领域,计算机系统更要承受外界环境的干扰,进一步增加瞬时故障发生的概率。为了提高计算机

学位

进程级软件冗余故障检测故障恢复多进程容错潜伏故障

银川大学文化与创办者文化的融合发展研究

银川大学作为宁夏回族自治区较早的民办高等职业院校之一,17年来走过了很不平凡的历程,但总的来说走出了一条符合实际的特色发展路子,为宁夏民办高等职业教育发展提供了重要

学位

高校文化创办企业文化融合机制

企业创新实践成果及知识管理系统研究与设计

企业创新实践成果与知识是一个企业重要的无形资产,通过研究企业创新实践成果及知识管理系统,实现对创新实践成果的集中管理,促进企业员工之间的经验共享与交流互动,并形成集

学位

企业信息化创新实践成果知识管理系统标题检索全文检索

英汉同声传译的困难与对策

本文为一篇MTI实践报告。该报告目的是透过案例分析,找出以耳语形式所做的同声传译中的主要困难,并提供可行的应对策略。首先,在口译任务描的部分,说明了笔者在考文垂和广东

学位

同声传译注意力管理噪音断句预测

《遇见更好的自己》翻译报告

随着经济社会的不断进步,人类财富的不断积累,人们生活水平的不断提高,人更加关注如何才能更加健康、幸福的生活,也因而有越来越多的人热切的想要知道,如何才能转变当下不甚

学位

目的论三原则翻译方法《遇见更好的自己》

基于时空上下文的视频目标跟踪算法研究

本文对基于时空上下文的目标跟踪算法进行了研究。时空间上下文跟踪算法通过分析目标周围空间上下文对跟踪目标进行定位。本文所研究的算法是一种快速的基于稠密时空间上下文

学位

时空间上下文多模板分块跟踪目标跟踪实时跟踪

基于社交网络本体的好友推荐策略研究与实现

目前的社交网络,普遍均有推荐用户的功能。传统的推荐算法,有基于内容的推荐、协同过滤推荐以及混合推荐,已经在许多网络平台上取得了良好的应用效果,但是算法本身仍然存在一

学位

社交网络本体推荐算法好友推荐

云存储中数据完整性保护的研究

随着信息化进程的深入和数字设备市场的蓬勃发展,数据量正在成倍地增长。海量数据的存储和管理促进了云存储的发展和应用,然而数据安全问题却阻碍了云存储的快速发展。用户将

学位

云存储数据完整性MAC散列函数冲突处理

基于时序模型的社会化推荐算法研究

近年来互联网技术不断发展,人们已经从信息匮乏的时代迈入大数据的时代。尤其是随着社会网络技术的发展,当用户在互联网上选择服务时,更信任和依赖自己的好友。然而面对海量

学位

推荐系统社会化推荐时序模型概率矩阵分解信任度

基于氮化物的RRAM器件研究

在包括物联网（IoT）在内的下一代数字技术中,非易失性存储器（NVM）将会扮演十分重要的角色。阻变式存储器作为一种新型非易失性存储器,由于具有结构简单、与传统CMOS工艺匹配度高、

学位

阻变存储器氮化物化学计量比导电机理

数据备份系统中有关数据碎片的研究

其他学术论文