基于HDFS的分布式文件系统数据冗余技术研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:yaoyaolf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的发展,存储系统占有举足轻重的地位。在数据爆炸性增长的今天,本地的存储很难满足不断增长的海量存储的需要,而且个人移动计算和企业级计算对底层的存储系统也提出了更高的要求,人们越来越多地使用分布式文件系统,它可以带来更高的存储能力、可靠性、安全性和移动性。本文主要研究了分布式文件系统的数据冗余技术。传统的分布式系统大多采用独立磁盘冗余阵列(RAID)和复制技术进行数据的冗余,要达到一定的可靠性对存储空间的要求较高。后来又出现了编码方法对数据进行编码存放,这在提高了可靠性的同时又带来了数据读取和写入时性能的较大损失。为了更好地平衡数据可靠性和读取性能,本文提出了综合采用复制和网络编码技术对数据存储的方案。在开源的HDFS(Hadoop Distributed File System)项目基础上,给出了文件分块编解码、编码块放置策略、文件读取和写入的完整流程和方案,之后又研究了如何进行负载均衡以及怎样在大规模廉价低可靠机器组成的集群上处理机器的频繁退出和加入的问题。借助于这种数据冗余技术,可以在相同的冗余度上提高数据的可靠性,同时又尽可能地降低编码对读取性能的负面影响。本文首先介绍了分布式系统的研究现状,研究了主流的架构技术,在介绍了各种数据冗余技术的基础上提出了复制和网络编码结合的方案,在HDFS架构下描述了具体的设计。最后对可靠性进行了理论分析和实际仿真,证明了该设计可以达到预期的效果。
其他文献
机器人利用机器视觉进行物体抓取是机器人应用领域的热门研究之一。目的在于靠机器视觉检测出被抓取物体的可靠抓取位置和方向,进而通过运动规划算法控制机械臂完成抓取动作
随着数码设备的日益普及以及互联网的深入人心,网络上的视频数据呈现出爆炸式增长。而在安全领域,快速增加的摄像头也渐渐的覆盖了城市的每一个角落。这些网站和设备在带来安全
互联网经过四十多年的发展,已经从面向学术的科研网络演变为推动社会经济发展的基础设施,但互联网在移动性、可扩展性、安全性上都逐渐暴露出了问题,由此引发了未来网络研究的热
作为配电网自动化系统的基础,FTU(终端馈线单元)的实现很大程度上取决于选取合适的远动通信协议。远动通信规约种类较多,针对各自特点和实际情况而被应用于不同的现场环境。但是,
海洋占据地球表面积三分之二,它是人类活动的重要领域之一。随着科技的不断发展,现代通信系统和网络已经从空中和陆地延伸到海洋,因此水声通信网络技术在近些年来得到了迅猛的发
稀疏表示的关键是构造一个有效的字典,使得训练样本(信号)在字典上的表示是稀疏的。常用的方法是解析法,该方法将字典中的原子用预定义的某种数学变换表示,如小波变换(WT)、
数据挖掘(Data Mining),即数据库中的知识发现(Knowledge Discovery in Database-KDD),是指从众多的数据中寻找那些具有特殊规律、特殊意义的并具有潜在应用价值的信息。数据
浅海水声信道是一个极其复杂的时、空、频变信道。信道带宽窄、多途干扰强、噪声高和传输损耗大是水声通信中实现高速可靠传输的主要障碍。正交频分复用技术(OFDM)是一种多载
利用移动手机进行通讯是现代人们沟通交流最重要的方式之一。移动通话网络的话单数据既体现了手机用户之间的通话关系,同时也能够反映人们之间的社交关系,因此可作为研究社交网
随着科技的发展,神经网络逐渐成为现代智能系统的一个重要研究领域。它在自动控制,智能机器人,医疗器件等方面有着重要的作用。本文中我们主要用MOS晶体管建立神经元以及神经网