【摘 要】
:
云计算是目前计算机领域最热的话题,HADOOP下的默认分布式文件系统Hadoop distributed file system(HDFS)因为其可靠性伸缩性以及在存储大文件时提供了强大的性能已经成为当
论文部分内容阅读
云计算是目前计算机领域最热的话题,HADOOP下的默认分布式文件系统Hadoop distributed file system(HDFS)因为其可靠性伸缩性以及在存储大文件时提供了强大的性能已经成为当今云计算研究领域事实上的标准,但在处理大量小文件时由于所有的文件请求都需要单Namenode进行处理,性能十分低下。本文首先对一些常用的分布式文件系统的原理以及内部实现做了简要介绍,然后对本文的目标原型HDFS作了深入的分析,包括架构,数据结构,数据块设置,以及读写策略,数据流模式等,并且分析了现有解决HDFS上小文件存储的一些方案的性能以及不足。针对HDFS存储小文件的不足,本文提出了一种通过Datanode缓存部分小文件元数据的策略来解决Namenode在存储小文件时的性能瓶颈,通过Datanode来缓存部分小文件的元数据,让客户端在请求数据时将绝大多数的小文件请求由Datanode进行处理,只有当Datanode请求不到需要的数据时才向请求Namenode进行请求,从而大量Namenode接受请求的次数,解决单Namenode由于频繁的请求造成的瓶颈。同时,针对Web2.0特殊的应用场景,需要对部分文件进行频繁的读写,会产生一些热点数据,针对这个特性,本文设计了两种方法来解决这个问题,首先本文采取了动态副本策略来复制一些高访问率的副本,增加这些数据的副本数,减轻缓存这些数据的Datanode的负担,其次本文在Datanode中直接建立相应的Cache缓存部分小文件数据,大大的提高了访问的效率。
其他文献
批判性阅读是高水平的阅读活动,它要求读者积极参与,用逻辑推理以及自己的知识经验来分析,评价和整合所阅读到的内容。在西方国家,批判能力受到很大重视,是学校教育的关键目
建立了一种利用反相高效液相色谱法同时测定啤酒中 9种有机酸的方法。应用反相C18色谱柱Nucleosil 10 0C18 2 5 0× 4 0mm ,以 0 1mol/LKH2 PO4(用H3 PO4调 pH3 0 )为流
近年来,汽车产销量的逐年递增导致能源危机越来越严重,石油价格不断攀升,交通成本迅速增加。汽车专家对汽车的燃油量与汽车重量的关系做了调查研究,发现汽车重量是决定燃油量大小
课堂教学是学生学习文化科学知识的主阵地,也是对学生进行思想品德教育的主渠道。要提高中数学课堂教学的效率,教师应为学生创设良好的课堂气氛,采取多种教学手段,充分发挥学
刑讯逼供罪是古今中外司法活动中一种常见的犯罪,但在我国表现尤甚,虽屡禁而不止。刑讯逼供严重违背人性,其做法残忍,与当代法治理念格格不入。各国均通过立法对此严格禁止,
近年来,尽管服装零售业的销售额在年年递增,但是越来越多的服装经销商、零售商却步履艰难。究其原因,一方面由于服装零售业经过多年的市场竞争洗礼,行业市场化程度越来越高而
通过研究三丁酸甘油酯和丁酸对圆弧青霉白色变株PI4 2生长及产脂肪酶的影响 ,建立了碱性脂肪酶高产菌的平板筛选模型。以该模型对PI4 2进行自然分离 ,从中得到一株遗传性状稳
酵母中蛋白酶A的释放对纯生啤酒的泡持性有不良影响。大豆提取液对蛋白酶A有一定抑制效果 ,其抑制效果与作用时间、作用温度以及抑制剂的浓度等因素有关 ,抑制剂对蛋白酶A和
21世纪是知识经济的时代,是人才的时代。随着经济的发展,社会已经从“工业经济时代”跨入“知识经济时代”。经济学界已经普遍承认人力资本是一种具有巨大价值增值潜力的资本
与C3植物相比,玉米等C4植物在高光强、高温和干旱条件下具有更高的光合能力和产量以及更强的适应性。PEPC是C4植物光合碳同化途径的第一个关键酶,许多研究者将C4植物的PEPC基