论文部分内容阅读
近年来,电子系统集成度提高带来了频发的间歇性故障,使容错方案的设计提出了新的挑战。观察故障对系统中各个层次的影响过程对容错方案的设计有重要意义。另一方面,为了评价各种容错方案,能够在方案的实现层捕获期望的行为显得尤为重要。基于仿真的故障注入由于良好的可观察性和可控性被广泛采用,但是传统的基于仿真的故障注入环境大多局限于硬件层次,不能观察故障在软件层的表现。然而,集成电路设计过程中已经广泛采用硬件/软件联合仿真技术,这为基于仿真的故障注入提供了新的框架,并且在国外的一些研究当中已经取得了部分成果。通过对软硬件联合仿真系统的裁剪可以快速建立一个层次化仿真系统,实现故障建模的精度和仿真效率的折中,并且接近系统实际运行环境,方便观察故障从硬件到软件的传播过程。 本文研究了基于联合仿真的功能验证环境。在此基础上,设计完成了基于联合仿真的故障注入平台,能够进行寄存器传输级的故障建模并观察硬件故障的结构级表现和对操作系统及应用程序的影响。 首先分析了基于联合仿真的处理器验证环境,剖析了验证环境的组成和模型之间的交互关系,结合故障注入实验的需求,提出了新的故障注入目标。 分别从系统组成、模块接口、处理器内部功能单元、处理器的流水线工作等角度分析了结构级模拟器的实现细节。从功能验证的角度分析了寄存器传输级模型的测试平台的组成、组件交互、仿真控制等实现方法。根据模拟器的接口,设计了故障注入平台的控制子系统,包括控制器、状态收集器、监视器、分析器等组件,能够自动化完成故障注入实验的进行、与寄存器传输级模型的交互、系统行为的捕获、实验结果的分析。在寄存器传输级模型测试平台基础上设计了故障注入子系统,主要由状态控制器组成,负责层次模型间的通信、状态初始化、信息交互、仿真进度的控制。 最后,利用故障注入平台完成了针对OpenSPARC处理器的故障注入实验,统计了故障在系统不同层次的表现,不同部件故障作用下症状的分布比例。对故障在系统中的传播过程和症状分布的规律和原因进行了分析。