面向Hadoop框架的节点容错技术优化研究与实现

来源 :东北大学 | 被引量 : 0次 | 上传用户:YOLANDA123456789
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
云计算技术已经广泛应用于各行各业,随着云计算技术的迅速发展,处理数据的规模不断扩大,数据类型呈现多样化。因此如何处理这些大数据成为急需解决的问题,其中MapReduce任务计算框架是当今最具代表性的分布式计算框架。随着分布式系统的规模不断扩大,系统中各部分组件相互之间的依赖关系也不断复杂化,使得系统发生故障的概率也不断增加。因此,分布式系统中节点容错技术成为了重要的研究内容,而节点故障检测机制又是节点容错技术的重要部分。在节点故障检测机制方面作业、节点状态、网络环境等因素都对检测的性能有重要影响,因此在考虑以上几种因素的基础上本文提出了两种机制:基于多因素的自适应心跳机制和基于作业因素的信誉值检测机制。用来对心跳频率做及时调整以适应不同的系统环境以及对系统中节点的状态做出一个实时的评价。在心跳机制方面,本文提出了一种多因素心跳检测综合指标评价模型。在该模型下同时考虑网络负载情况和节点CPU工作状态及节点作业的大小对心跳检测过程的影响。在此基础上,提出了基于多因素评价模型的自适应心跳检测算法,该算法可以随网络环境、节点CPU占用率、作业任务大小自适应地改变心跳频率,综合各因素给出心跳频率设定的最优方案。并通过实验验证了多因素对心跳频率自适应调整的影响。在心跳机制的基础上提出了基于作业的信誉值检测机制,该机制赋予系统中节点一个信誉值并根据心跳信息和作业类型对某一个节点的信誉值进行衰减或者恢复。当一个节点信誉值低于最小阈值时就认为该节点发生故障,当一个节点的信誉值增加到最大阈值时就不再增加该节点的信誉值。大量实验数据证明在系统中加入基于作业的信誉值检测机制比原系统能更快地发现故障节点并及时进行任务重新分配。从整体上缩短了作业的执行时间。最后通过实际应用和实验验证了在经过以上方法优化的Hadoop系统中,能够比原系统更有效地检测到故障节点并更快地进行任务的重新分配。
其他文献
本文通过对普惠金融发展现状、小微企业融资情况的现状分析,认为在小微企业融资方面,除了从普惠的方式上进行改革外,还应在其监管体制上进行完善,以促进小微企业的融资。
针对少数民族地区体育立法少、效力低,理论研究不够成熟,地方性体育法规忽视民族传统体育自身内容,不重视体育法制宣传与体育法律队伍素质不高等问题,提出了完善民族体育立法
利用高频电感耦合等离子体原子发射光谱法(ICP-PES)测定了小鼠一次性力竭游泳运动后,骨骼肌内铁(Fe)、锌(Zn)、铜(Cu)、硒(Se)、钙(Ca)、镁(Mg)6种元素含量的变化.结果表明,
目的:本研究通过观察多囊卵巢综合征(PCOS)合并胰岛素抵抗(IR)并且中医辨证为肾阳虚型的患者采用随机双盲的方法服用艾附暖宫丸及二甲双胍后进行随访,对其多毛、痤疮、体重指数、性腺水平、血脂相关数值及中医证候等疗效与安全性进行分析。为PCOS-IR患者的诊疗提供更多更有用的研究依据。方法:通过观察在新疆维吾尔自治区中医院于2018年1月至2019年11月期间就诊门诊、住院部的患者,把66位属于诊断