面向恢复的容错计算技术研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户：liuandhll

【摘要】

：

高可靠容错计算机的成本、可实现性和可扩展性问题一直是困扰其开发和广泛使用的主要问题,而利用商用计算机成熟硬软件技术和资源(COTS技术)实现容错计算系统,拥有传统专用容

【作者】

：

李海山

【出处】

：

哈尔滨工程大学

【发表日期】

：

2007年期

【关键词】

：

容错集群服务器故障恢复向前恢复透明性动态检查点策略

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

高可靠容错计算机的成本、可实现性和可扩展性问题一直是困扰其开发和广泛使用的主要问题,而利用商用计算机成熟硬软件技术和资源(COTS技术)实现容错计算系统,拥有传统专用容错设计没有的许多优点,成为了容错技术研究热点。但在当前以COTS技术为基础的软件和软硬件协同实现的容错计算系统中,如何实现容错功能的透明性和提高故障检测、诊断、恢复的效率,减少对系统正常工作的影响一直是研究的重点和难点问题;另外,目前使用广泛的基于卷回的故障恢复机制存在一些先天不足,必须加以克服。基于此,本文在对目前国内外一些容错计算系统的实现原理和集群技术进行深入研究后,提出了利用COTS技术、容错和集群思想,实现容错集群服务器的结构模型,以满足一些领域对服务器高可靠、高可用及高性能的要求。研究并实现了一种基于PC/Linux平台下结合容错技术和集群技术优点的OPIAC容错集群服务器系统,对其故障发生情形进行了分析研究,重点研究了它的故障恢复模型和策略、检查点实现技术,并对系统性能进行了评估。首先,对几种具有典型代表性的容错计算系统体系结构进行了分析,对当前容错系统设计中使用的故障恢复机制、方法,检查点技术实现原理进行了研究,分析了影响检查点系统开销的关键因素、检查点技术的演化趋势及基于检查点技术实现COTS智能容错计算和故障恢复存在的困难及目前需要解决的一些主要技术问题。其次,研究了在有备份模块和无备份模块的TMR容错结构中故障发生及故障恢复的各种情形,定量分析、比较了两种容错体系结构下使用的故障恢复算法的效率;根据实时应用系统对实时任务(进程)运行时间的限制,研究了检查点设置间隔(两次进程状态保存之间的时间)对进程正常运行的影响,给出了一种满足实时应用需求的动态保存进程状态的检查点设置策略。为进一步提高故障恢复效率,提出了智能容错系统的透明、并行故障恢复算法—阶梯型算法。第三,提出了一种基于COTS技术、结合容错技术和集群技术构造高可靠和高性能容错服务器的思想,并据此基于PC/Linux系统平台,设计实现了一个集成了容错机高可靠性、高可用性和集群系统高性能的OPIAC容错集群服务器。通过对Linux内核的改造和扩充,采用具有自主处理能力的容错管理模块完成系统容错功能,实现了容错功能对应用的透明,一方面对在OPIAC容错集群服务器上运行的应用程序的编写和运行没有任何限制和附加要求;另一方面对与服务器通信的客户端应用来说,感觉不到服务器内部的故障检测、诊断和恢复及服务进程在内部节点间的迁移过程,并且不影响新的网络连接的建立。详细描述了实际实现中进行故障恢复时,为了有效减少故障恢复时间,提高容错服务器执行效率采用的多种措施。通过设计虚拟设备驱动层、设备资源管理层和内核服务仿真层,并将其与基于日志的故障恢复算法配合使用,克服了基于检查点的传统卷回恢复技术在I/O恢复方面存在的不足。最后,详细介绍了在Linux操作系统中如何实现对进程状态的保存和恢复。

其他文献

课堂文化的生态哲学解读

课堂教学改革的核心与终极目标是改革课堂文化,而课堂文化的改革需要建立在对课堂文化的新认识基础上。本文尝试运用生态哲学的观点重新解读课堂文化的内涵,探讨课堂文化的构

期刊

课堂文化内涵构成生态哲学

广西沿海重要海湾环境承载力评估

以广西沿海的珍珠港、防城港、廉州湾、钦州湾、铁山港5个海湾为例,通过剖析环境承载力的内涵,根据海洋环境的生态服务功能,构建了海洋环境承载力的评估指标体系。从定量表达

期刊

广西沿海环境承载力指标体系评估模型

基质金属蛋白酶-2,9及细胞外基质金属蛋白酶诱导因子与骨肉瘤患者性别、年龄、预后的关系

目的检测基质金属蛋白酶-2(MatrixMetalloProteinase-2,MMP-2)、基质金属蛋白酶-9(MatrixMetalloProteinase-9,MMP-9)及细胞外基质金属蛋白酶诱导因子(ExtracellularMatrixMe

期刊

骨肉瘤免疫组织化学金属蛋白酶类细胞外基质

高速公路灭火救援作战安全对策

近年来，全国消防部队在处置高速公路突发事件时救援人员伤亡事故时有发生。本文结合近年来全国消防部队在处置各类高速公路灾害事故中造成官兵伤亡的案例，根据笔者多年灭火救援

期刊

消防高速公路作战安全对策分析

千山产东北小鲵的早期发育

千山产东北小鲵为体外受精。精子形态似针状，分头、体、尾三部分。头、尾部纤细，二者长度比为１：４，直径比为２：１，体部很小，呈梭形。胚体从受精卵到孵出历时为１５．０２天左右，一般在每年的五月上旬均

期刊

千山东北小鲵早期发育

机敏异漏斗蛛体表超微感受器的扫描电镜观察

为了阐明机敏异漏斗蛛(Allagelena difficilis)对外界刺激的感受机制,利用扫描电镜对其体表的超微感受器进行了观察。机敏异漏斗蛛的体表感受器多样,毛状感受器的种类和数目

期刊

机敏异漏斗蛛扫描电镜毛状感受器裂缝感受器机械感受器

浅谈高职院校智慧校园系统平台构建

智慧校园是以借助新一代的物联网、云计算、泛在感知等信息技术,打造物联化、智能化、感知化、信息化的新型校园。智慧校园智能应用系统及平台的建设是在网络基础设施建设的

期刊

智慧校园应用系统平台构建

新课程背景下高中历史课堂教学的设计策略探析

素质教育的大力推广,使传统的授课方式发生了很大的改变,教学方式不再局限于老师授课,学生认真思考的地步。加上最近几年新课程的改革,使得习惯于传统授课方式的老师也接受了

期刊

新课程高中历史课堂教学

如何培养学生解应用题的能力

如何培养学生解应用题的能力，笔者认为可从以下几个方面进行：一、注意应用题的阅读指导，培养审题能力。有的应用题的数量关系比较抽象，而且复杂多变，常有学生因审题不准而将题解错

期刊

应用题培养学生五年级学生

基于空心球聚合体的多孔介质有效导热系数的两种模型

根据硬硅钙石型微孔硅酸钙的结构特点,将其简化成空心球聚合成的多孔介质,建立了点接触空心球壳与面接触空心立方体两种单元体模型.采用一维热传导分析,推导出有效导热系数的

期刊

导热系数多孔介质硬硅钙石:硅酸钙绝热材料

面向恢复的容错计算技术研究

其他学术论文