重复数据删除技术的研究与实现

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:robinlaikankan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息数字化的快速发展与生产力的突飞猛进,当今企业对信息的存储需求也在飞速增长。尽管存储设备的销售价格在不断地下降,但远远赶不上企业内部产生和需要保存数据的攀升速度。重复数据删除技术能够删除重复的数据,实现数据的唯一实例存储,将有望解决该问题。该技术一般应用在备份、归档等集中式数据存储的系统中,能有效地节省存储空间和网络的传输带宽。目前,对文件或数据流中重复数据的查找效率始终是重复数据删除技术应用的瓶颈,为此重点对提高重复数据的查找效率进行了研究,并将重复数据删除技术融合到数据备份领域实现了高效的、稳定的数据容灾备份系统,它可以为数据提供安全的存储服务。该系统运用了多项技术来提高数据的备份和恢复性能:元数据的多级查询机制、数据缓存机制和多线程技术。元数据的多级查询机制通过使用全局Bloom Filter、二级索引缓存和磁盘哈希表来提高对重复数据的查找速度;数据缓存机制则通过对数据块的内存缓冲,可以避免对磁盘频繁的I/O操作;多线程技术可以提高系统的并发处理能力,从而在整体上提升系统的性能。测试表明,提出的重复数据删除技术能有效地提高备份和恢复性能,同时,能极大的减少冗余数据的存储,节省存储空间,提高备份容灾系统的存储效率。
其他文献
近些年来,随着金融危机的爆发和一批知名企业的破产,使得世界范围内的风险管理理论和实践飞速发展,越来越多的企业开始注重风险管理,并不断的提高自身的风险管理水平。风险评
为适应气象业务发展需求,提高气象业务服务能力,结合现代天气预报业务发展形势,进一步探索高空天气系统自动分析算法和技术。位于对流层中层的500hPa高空天气系统对气象防灾
近年来,对等网络(P2P,Peer-to-Peer)作为一种新型的网络应用模型以其可扩展性、高度容错性等优点变得越来越流行。P2P网络为资源的快速共享提供了良好的平台。P2P网络中资源的
随着互联网技术的飞速发展,网上信息量剧增,人们从海量信息中挖掘出可用信息日益困难。目前人们采用搜索引擎的方式在互联网上检索信息,传统搜索引擎,如国外的Google,yahoo,
如今,随着信息技术的发展,Internet从最初仅有4个节点,主要用于军事目的的网络发展到今天能沟通一百多个国家,包含数百万个网络,连接数亿台主机,覆盖数十亿用户的全球性网络,
博客作为互联网上一种较新的传播形态,已经成为网络舆论传播的重要场所。以现代网络技术和通信技术为支撑,博客正越来越广泛的成为政府、企业、部门和团队之间的沟通工具。在对
访问控制通过对用户访问系统资源进行安全控制来保护系统资源。基于角色的访问控制模型适合对各种访问控制需求进行建模而且能够简化访问控制管理,基于角色的访问控制模型作为
随着改革开放的日益深入和交通、电信等相关产业的快速发展,在全球化迅猛发展的今天,商务和休闲旅游等跨区域移动外出活动日益频繁,仅以旅游为例,2010年我国境内旅游人数就高
网络技术日新月异的发展给人们的生活和工作带来了乐趣和便利,越来越多的人使用网络来处理各类事宜,网络的上的信息遍布各个领域,因此网络成为了黑客们攻击和入侵的沃土,他们
随着社会的进步,各行各业的流程日趋规范。从高校、税务局、工商管理部门等非盈利性机构,到餐饮、装备制造等盈利性组织,都遵循“按流程办事”的准则。信息化时代为流程的自