面向软错误的故障恢复和验证技术研究

被引量 : 0次 | 上传用户:yu23344
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着集成电路制造工艺的发展,现代微处理器的性能在大幅度提高的同时,面临软错误的威胁也越来越严重。软错误是由外部环境中的高能粒子辐照或电压扰动、地磁干扰等因素诱发的一种硬件瞬态故障现象。它不破坏电路的内部结构,但是却可以通过改变处理器状态或者存储单元值等方式影响程序的正常运行,从而对系统可靠性造成严重影响。为提高系统可靠性,国内外纷纷开展了容错技术的研究。从实现方式来看,面向软错误的容错技术主要可以分为硬件实现的和软件实现的容错技术。与硬件实现的容错技术相比,软件实现的容错技术无需改造或重新设计硬件,具有实现成本低、开发周期短、可灵活配置等优势而备受关注。从软错误的处理过程来看,软件实现的容错技术主要包括这几个方面的研究内容:软错误的影响分析和评估、错误检测、错误恢复、容错优化配置和容错算法验证。由于目前的研究大都集中在软错误的影响分析和错误检测方面,本文主要针对错误恢复和容错算法验证展开研究。本文的主要贡献可分为以下四个方面:1.本文提出一种基于格式化标签分析的控制流恢复技术,使得错误检测后程序状态能恢复至故障发生前的一个正确状态,确保程序继续执行且输出正确结果。该方法首先在汇编语言级上将程序代码划分为无存基本块,并为每个无存基本块分配格式化的静态标签;然后基于分配的静态标签添加控制流检测和恢复指令,其中检测指令主要负责控制流检测而恢复指令主要负责恢复由控制流错误导致的程序数据流错误;最后定义分层故障处理例程,即为每个过程单独定义一个过程错误处理例程和为整个程序定义一个全局错误处理例程。该方法首次解决了过程间的控制流错误检测和恢复问题,能检测和恢复所有的基本块间的控制流错误,并能检测和恢复绝大部分的基本块内部的控制流错误。与纯控制流检测算法相比,该方法在控制流错误检测的基础上以相对较少的性能开销实现了错误恢复。2.本文提出一种源代码级的数据流错误容错处理机制,主要包括三个方面:(1)基于基本块的概念给出包含块的定义,该错误处理机制以包含块为基本单位对数据流错误进行检测和恢复,确保包含块内发生的数据流错误不会传播至块外。(2)提出一种基于差异转换和冗余复算的错误检测机制,其基本思想是基于一组差异转换规则,将原程序转换为功能完全一致的冗余程序,通过在特定位置插入比较检测语句来判断程序运行过程中是否发生软错误。(3)提出一种应用级检查点备份的数据流错误恢复机制,即通过求解数据流分析方程得出检查点包含的变量集合,以此为依据插入恢复代码。为自动生成容错程序,本文设计并实现一个源到源的转换工具。故障注入实验和性能开销实验结果表明:与其它源代码级数据流错误容错方法相比,该方法能以相对较少的性能开销达到较高的错误覆盖率。3.本文根据模型检验原理,提出一种通用的针对基于标签分析的控制流检测算法的形式化验证方法。该方法首先对待验证目标——基于标签分析的控制流检测算法进行概述;在此基础上将容错程序建模为控制流状态机,并给出其语法和语义的定义;然后对控制流状态机进行进一步具体化,通过定义一个状态转换系统来描述控制流检测过程状态的转移;并基于状态转换系统和模型检验工具的对应关系,将状态转换系统转换为模型检验工具的输入程序,以进行自动验证;最后以代表性的控制流检测算法CFCSS算法和DSM算法为例,说明该方法的实用性。验证结果表明:该验证方法首次发现了DSM算法的检测盲点,以及与CFCSS算法中标签设计相关的一些检测盲点。4.针对数据流容错算法的有效性验证,本文提出一种基于汇编语言类型系统的形式化验证方法。它的基本思想是给汇编语言加上静态类型属性,通过类型安全性来保证程序的容错属性。本文以典型的数据流恢复算法SWIFT_R为例,首先给出类型化的容错汇编语言TFAL的语法,通过将一条指令的执行建模为状态的一次转移,对TFAL的操作语义进行解释;在此基础上对TFAL的指令进行类型检查,得出了SWIFT_R算法的检测盲点;在假定排除这些检测盲点的前提下,首先证明了TFAL系统的类型安全性——前进和保持属性。然后在此基础上定义状态的相似关系,进一步证明了SWIFT_R算法的容错属性,即原程序在无错环境下运行的输出结果与容错程序在错误环境下运行的输出结果一致,且状态转移过程相似。
其他文献
介绍工程造价风险管理,阐述了控制材料价格风险的重要性,探讨有效控制材料价格风险的措施,并结合齐鲁分公司实际情况,提出控制材料价格风险的建议。
信号交叉口延误,是评价交叉口的运行效率和服务水平的重要指标。本文以哈尔滨市学府路与学府四道街交叉口为例,组织48名调查员分车道、分流向对该交叉口各入口同时进行实地交
情感素养教育是指导学生正确理解情感的教育,通过这种教育培养青少年对自我情感分析的能力,使其能够充分利用情感资源完善自我,以促进其身心健康成长。情感素养教育的前提是
依据寒区55座典型公路装配式梁桥的单层水泥桥面铺装破损状况调查资料,从桥梁和桥面本身结构特性、桥面铺装材料及施工工艺、铺装设计理论、使用和养护等4个方面对水泥桥面铺
随着全球区域经济一体化的深入推进,生产要素在世界范围内加快流动和重组,国际产业更新换代加速并在全球范围内重新布局。发达国家纷纷提出“再工业化”战略,大力发展高新技
滚动轴承是机械工业使用广泛、要求严格的配套件和基础件,被人们称为机械的关节。作为装备的关键部件,滚动轴承一旦失效将严重降低装备的战斗力,甚至造成灾难性事故。滚动轴承的
内容提要随着灾难频发、社会不稳定因素增多,以抗灾救灾、维稳处突为主的非战争军事行动已呈现常态化趋势,围绕非战争军事行动的新闻也呈铺天盖地之势,如何提高非战争军事行
随着科学技术水平的飞速发展,当前无线移动终端设备使用的普及,WLAN的迅速崛起,无线移动终端设备已经成为了人们工作、学习、生活当中不可或缺的一部分。而餐饮也是人们必不可少
频谱接入是无线认知网络研究的核心问题,通过认知用户对授权频谱的接入共享来实现频谱利用率的提高,从而满足越来越多无线应用的频谱资源需求,缓解频谱资源缺乏和已授权频谱利用
机电作动器作为飞行控制系统中的主要执行机构,必须具有很强的可靠性和容错性。本文以减小机电作动器的体积、提高机电作动器的容错性和可靠性为目标,设计具有容错性和高可靠性