一种分布式文件系统元数据服务的高可用设计与实现

来源 :南京大学 | 被引量 : 0次 | 上传用户:DownLoad0005
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在如今海量数据的时代,传统的单机文件系统无法满足爆炸式增长的数据存储需求,分布式文件系统凭借其大容量、高性能、高可扩展性等特点,在社会上得到越来越广泛的应用。由于分布式文件系统的重要定位,如何保证系统可用性就显得至关重要。目前主流的分布式文件系统大多采用元数据和实际数据分开存储的方式,且对元数据的操作比例远远大于对实际数据的操作,因此元数据服务的可用性很大程度上决定了整个分布式文件系统的可用性。国内某互联网A公司自研的分布式文件存储系统AFS采用元数据集中管理的方式,其元数据服务的高可用方案目前采用主从模式,类似于HDFS热备份节点的方式。但该方案较为依赖共享存储,其共享存储系统依赖keepalive机制,容易出现交换机的单点故障,且在特定情况下会出现无法切主的情形,不利于AFS文件系统的推广使用。本文基于对元数据服务高可用技术的研究,对AFS文件系统的元数据服务高可用方案进行升级改进,主要工作如下:1.本文分析了AFS现有元数据服务高可用方案存在的问题,提出基于Raft协议来实现节点之间的日志数据同步,进而实现元数据服务的高可用。2.本文详细分析了Raft协议的重点环节,包括选主、日志同步、日志压缩等过程的具体实现。同时由于AFS文件系统应用的业务场景需要极高的系统可用性,提出基于Learner角色的Snapshot方案,其中单独Learner节点不参与选举工作,只负责学习日志并完成Snapshot,从而解决节点做Snapshot期间服务不可用的问题。3.基于Raft新架构下,本文详细实现AFS文件系统元数据服务的高可用模块,包括但不限于Learner角色的工作流程,日志双写,Snapshot生成与加载过程,运维工具等。4.本文对Raft新架构下的高可用模块进行可用性测试和性能测试。结果表明,在新高可用方案下,系统出现故障后可以在极短时间内恢复系统服务,从而保证了系统的高可用性;且对于元数据性能和系统整体影响较小,采用ssd方案后性能有大幅提升。该高可用方案目前已在A公司AFS集群中应用,上线升级了数十个集群,运行状况良好。新架构很好地解决了之前旧架构存在的问题,保证了系统元数据服务的可用性。
其他文献
网络中包含大量数据,并且这些数据中蕴含着有价值的信息。网络大数据挖掘是利用数据挖掘相关技术从网络大数据中提取模式和知识,例如从网络中的用户历史行为数据中挖掘用户的兴趣信息、在网络时序数据中识别异常数据。目前研究人员已经成功地将深度学习技术应用于网络大数据挖掘的研究工作中,相比于传统的统计学算法,基于深度学习技术的算法的性能具有显著的提升。变分自编码器是一种深度生成模型,并且已经成功地被研究人员应用
燃烧反应遍布于日常生活中,也广泛存在于火力发电、冶炼金属、航空航天等工业化进程中。而火焰是燃烧反应的“可见形态”,对火焰温度场的研究既可以用来探索燃烧反应的演化规律、解释燃烧现象的本质特征,又可以给节能环保提供重要的科学依据。现如今,成熟的温度场测量方法所测的结果大多是二维的。而研究人员在这些方法上,通过搭建复杂的大型系统、经过繁琐的计算步骤,实现了特定火焰三维温度场的重建,但是这些三维温度场重建
超声测距已经被广泛应用于各类移动设备的定位和追踪。超声测距技术的发展对于下一代应用诸如虚拟现实/增强现实、人机互动以及室内定位等至关重要。相比于基于视觉以及基于射频信号的方案,本工作选择了基于声波的方案有以下考虑1)声波传播速度是电磁波的百万分之一,相比之下能实现更高的精度。2)得益于普遍集成的扬声器和麦克风,很多商用设备可以支持场景构建。3)采样率低、计算性能要求低、硬件价格低,因此处理成本比较
经典通信的安全性是基于求解大数问题的困难性,而随着计算机算力的增加乃至量子计算机的出现,经典通信的安全性受到了严重的威胁。而量子通信技术却可以从根本上保证通信的无条件安全性。近30年来,量子通信的研究不管是理论上还是实验上都取得了丰硕的成果。本文针对量子通信,分别研究了双方情景下的量子密码协议和多方情景下的量子网络通信,主要的内容如下:1)基于测量设备无关和错误估计,提出了两个新颖的双方量子通信协
在我国反洗钱领域,人民银行会定期对证券公司的交易数据进行稽查,要求公司上报洗钱交易数据。人民银行发掘真实洗钱数据并且与公司上报数据进行比对,如果公司存在漏报、误报的情况,则进行大额罚金处罚。其中,股票交易数据属于结构化数据,存储在关系型数据库中。由于表结构复杂,表与表之间关系繁多,可疑数据难以准确定位。因此,证券公司需要构造数据对自身交易合规监控软件进行测试。当前,测试数据通过反洗钱专员根据反洗钱
深度学习的成功依赖于大规模具有精确标记的数据。获取数据真实标记需要大量人力物力,代价昂贵。实际应用中标记通常由众包等廉价方式收集所得,往往带有噪声。如果盲目地使用带噪标记数据进行学习,深度神经网络的性能会受到严重影响。因此,如何处理噪声标记近年来成为研究热点。基于小损失准则(small-loss criterion)的样本选择方法是当前深度学习中处理噪声标记使用最为广泛的方法之一。这一准则从带噪标
日冕物质抛射物(Coronal Mass Ejection,简称CME)是在太阳大气中发生的最猛烈的爆发活动之一,通常携带大量的高能粒子,对空间环境和人类活动有着很大的影响。研究CME的活动迹象,有利于更加清晰地了解它们的运动过程,从而进行空间天气预警,降低灾害。目前的CME编目主要为手工制作和传统图像处理生成,手工编目具有明显的主观性和耗时性,而传统方法的识别结果总是存在一些误差。深度学习在目标
异质界面广泛存在于光电子器件中,对器件的性能起着至关重要的作用,是当今微电子技术蓬勃发展的基础。界面工程为提高有机场效应晶体管(organic field-effect transistors,OFETs)的器件性能以及开发新功能提供了一条有效且充满潜力的途径。目前,自组装分子单层(self-assembled monolayers,SAMs)用来修饰有机场效应晶体管中的关键界面已成为一种应用广泛
随着互联网的发展,用户能够在互联网平台中随意发布视频内容,这些内容可能存在多种违规问题,平台需要对其进行审查。传统条件下以人工审查视频内容为主,这种方式准确度较高,但是随着平台的发展、用户生成内容数量的上升,人工审查的高成本与低效率已经远远不能满足要求。因此企业平台需要一个自动化视频内容审查系统,并且该系统能够在大数据量高并发的场景下保持准确性与高性能。目前新兴的趋势是使用神经网络识别视频内容中的
场效应晶体管(FET)可利用电场掺杂效应,通过电流电压测试,获得半导体材料的载流子迁移率,同时也是电子产品中广泛使用的开关元器件。与传统的无机场效应晶体管相比,有机场效应晶体管(OFET)具有可制备在柔性衬底上、可大面积加工、加工工艺简单、制造成本低等优点,在大面积电子电路印刷以及柔性电子设备上有着巨大的应用前景。有机场效应晶体管的关键组成部分是有机半导体层,聚合物半导体因其可在柔性衬底上制备引起