基于HDFS的云存储系统设计与实现

来源 :厦门大学 | 被引量 : 0次 | 上传用户:nightwish110
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数据爆炸的时代到来,海量数据存储的问题也随之而来。HDFS(Hadoop Distributed File System)作为主流的开源云计算系统Hadoop的基础构件之一,由于其低成本、高度容错、支持大数据集等特点成为解决数据密集型应用的海量数据存储问题的首选方案之一。在HDFS越来越被广大企业重视和采用的时候,HDFS存在的一些问题也逐渐显现。首先,因为HDFS采用Master/Slaves主从架构,一旦Master节点发生故障,整个集群都无法提供服务,因此HDFS存在单点故障。其次,目前针对HDFS系统的访问还没有很友好的用户访问工具,使用起来门槛较高。  本文通过对HDFS的应用现状进行研究,从集群可用性、访问便捷性以及监控维护简易性等角度对HDFS进行改进,提出了一个多角度的基于HDFS的云存储系统构建方案。该方案的主要优点在于:(1)利用DRBD和Heartbeat实现了Namenode的双机备份,解决了HDFS的单点故障。(2)利用次备节点定期Checkpoint,优化了Namenode重启过程,减少了Namenode重启和切换过程中的等待时间。(3)改进了WebHDFS,实现了基于Web的文件存储系统,提供了直观便捷的文件系统访问方式。(4)采用Ganglia作为集群监控方案,提高了集群的可监控性和易维护性。
其他文献
Euclidean最短路径(ESP)问题是计算几何领域的经典问题。本文针对LR可视多边形中ESP问题的求解算法研究,设计出一个简单、可行的求解算法,为解决一些实际应用问题(如巡视员问
科技的进步,推动农业机器人技术迅猛发展。在农业生产中,采摘是一个重要的环节,它的工作量约占整个工作量的一半以上。采摘机器人作为农业机器人的一个主要的类型,能够提高劳动生
  Internet 的高速发展使得互联网逐渐渗透到人们的日常生活中,对社会的方方面面产生了深远的影响。权威机构的调查显示,互联网用户数量每年都在飞速递增,并且中国的网民数量
随着信息技术的高速发展,云计算已经成为了产业界、学术界以及政府等各界关注的焦点。至今为止,云计算凭借其自身的便利性、高效性和高扩展性等优势吸引了众多企业的目光。云
总体经验模态分解(Ensemble Empirical Mode Decomposition,简称EEMD)是针对经验模态分解(Empirical Mode Decomposition,简称EMD)中存在的模态混叠问题提出的一种非平稳信号
随着大数据量计算技术的发展,基于数据处理的应用受到广泛关注,而数据源的结构也显示出多样化的趋势,这些数据中不仅有传统的非实时的、静态结构化数据,还有很多实时的、动态产生
随着信息技术的发展,网络上数据以指数级在增长,出现信息过量的情况。这种状况使得用户不得不花费大量的时间和精力寻找有用的信息。在此背景下,推荐系统应用而生,帮助用户走
在实际生活中,摄像机经常被安装在停车场、交通路口、机场、银行等地方进行监控。由于需要配置人员来进行持续的监控导致这是一项乏味并且耗时的工作。如果能够开发一套自动化
无线传感器网络技术是现代技术研究的热点方向之一,有着重大的应用前景和科学研究意义。但是无线传感器网络中的节点往往带宽和能量有限、计算和存储能力较弱,传统无线路由协
离群点检测是数据挖掘领域一个重要的研究方向,用于揭示隐藏在数据中的重要信息,尤其在医疗诊断,入侵检测网络,信用卡欺诈,传感器敏感事件检测,地球科学等领域被广泛应用。而由于人