论文部分内容阅读
在整个SoC设计中,存储系统已成为主要的性能瓶颈之一,其设计的优劣直接影响SoC整体性能。从真实的开发板硬件只能获得平均访存延迟和平均带宽等参数,对于存储控制器内部的运行状态则无法获知,这对研究和评估存储系统,找出设计瓶颈并进行优化来说非常困难。而通过时钟精确型的功能仿真则可以获得存储控制器任一时刻的运行状态,获得更多的微架构性能参数。DRAMSim2是一个周期精准的存储系统仿真器,但是在一些方面如地址映射、命令调度、时序参数等与真实的存储器件存在一定误差,导致仿真结果不可靠。因此,对DRAMSim2模型其进行优化和适配,提高其准确性具有重要的意义。本文的目标是在周期精准的存储控制器模型DRAMSim2的基础上,通过对其适配与建模,使之与一款流行的开发板Odroid-U3的存储系统相匹配。DRAMSim2不能单独工作,需要输入访存Trace流,因此需要将全系统仿真平台Gem5的存储模型采用DRAMSim2进行替换,并从Gem5中获取访存Trace流。本文首先将Gem5的CPU和Cache部分配置为与Odroid-U3相一致,以减少Trace流引入的误差。接着通过基础实验得出DRAMSim2与Odroid-U3存储控制器之间的误差,并根据存储控制器工作原理,从总线接口模块、命令调度模块和存储接口模块三个模块分析DRAMSim2仿真产生误差的来源。最后本文对DRAMSim2模型的总线接口模块修正访存队列深度,对于命令调度模块建立地址映射机制和FR-FCFS调度模型,对于存储接口模块修正访存协议命令延迟公式。通过对适配后的DRAMSim2模型进行访存延迟和带宽的测试,与适配前相比,平均访存延迟误差从适配前的40.5%下降为12.5%,平均访存带宽从适配前的21%下降为8.33%。