【摘 要】
:
超标量处理器中指令的动态调度技术可以有效地减少按顺序处理时流水线的停顿,提高指令执行的并行性,进而提升处理器的性能。然而,指令的动态调度也会改变访存指令的执行顺序,破坏访存的局部性,提高D-cache的缺失率。此外,在动态调度中load指令的推测加载也会产生违例,带来replay penalty。因此,本文修改了gem5仿真平台源码并量化分析了影响D-cache缺失率的因素和违例load指令带来的
论文部分内容阅读
超标量处理器中指令的动态调度技术可以有效地减少按顺序处理时流水线的停顿,提高指令执行的并行性,进而提升处理器的性能。然而,指令的动态调度也会改变访存指令的执行顺序,破坏访存的局部性,提高D-cache的缺失率。此外,在动态调度中load指令的推测加载也会产生违例,带来replay penalty。因此,本文修改了gem5仿真平台源码并量化分析了影响D-cache缺失率的因素和违例load指令带来的replay penalty,这有助于深入理解这些机制并为处理器的设计提供参考。在研究指令的动态调度对D-cache缺失率的影响时,本文首先说明了堆栈距离理论在预测乱序处理器D-cache缺失率的不适用性,接着深入分析了影响访存指令执行顺序的因素。对SPEC2006中14个测试程序的仿真结果表明,store-to-load forwarding因为发生的概率低于6.5%,对D-cache缺失率提升较小。Non-blocking issue机制结合了load指令的推测加载时,在采用conservative、store sets和blind的调度方式中相对于顺序执行,其D-cache缺失率平均提高了1.839,2.085,2.064倍。虽然这些影响因素增大了D-cache的缺失率,但也减少了流水线中的延迟和“汽泡”,提高了处理器的性能,因此现代超标量处理器仍然采用这些机制。在研究指令的动态调度对CPI的影响时,对SPEC2006中14个测试程序的仿真结果表明相对于顺序执行,采用conservative、store sets和blind三种乱序执行方式分别对处理器的性能平均提升了1.514495、1.708431、1.708162倍。本文的研究还发现load指令推测执行所造成违例的replay penalty集中分布在11到13个周期,并且load指令违例的惩罚时间占总CPI较小,最大不超过5%。随着ROB、IQ、SQ的增大,load指令违例数目逐渐增多,违例的惩罚时间也在增加,但由于稳态CPI的降低,不同测试程序中总的CPI变化趋势也不相同。
其他文献
在对Web应用挖掘的基本步骤作系统性研究的基础上,设计了一个Web应用挖掘可视化系统。该系统能够对用户访问Web时服务器方留下的访问记录进行挖掘,从中得出用户的访问模式和
以吴江公路信息系统开发为例,介绍了公路信息系统的架构,公路基础数据库的设计,基于桩号的线性坐标系统变换,桩号定位和桩号识别技术。采用(B/S)和(C/S)相结合的模式组建信息系统,以公路基础数据库为核心,针对管理部门和公众开发不同服务。将地图数据、属性数据、路产设施数据及交通管理数据分离,以公路路线为基本单位进行管理,以事件表形式存储所有相关路产设施。利用车载GPS设备获取路线资料,利用桩号进行线
以南昌航空大学学生体育消费现状为研究对象,主要针对体育消费动机进行调查,结果表明学生体育消费动机主要有五类,其重要性顺序排列依次为:身心健康(50.1%)、审美娱乐(30.2%)、社会交往(10
针对军事配送的特点,以“等待损失”和运输成本最小化为目标,建立了问题的数学模型,并应用蚁群算法求解了这一问题。算法中改进了状态转移规则,设计了局部搜索模块。为测试算
文章简述了我国高速公路及其通信系统建设的现状,分析了我国高速公路通信系统的特征和功能,提出并论述了以"建立统一的网络通信平台,服务交通信息化"为目标的高速公路通信系
大港油田D区块为复杂断块油藏,面临剩余油分散、含水率高以及采收率低等现状,其地质储量占整个油田的50%以上。本文以大港油田D区块为研究对象,运用了油藏数值模拟技术,进行了动态分析评价和生产历史拟合研究,分析了剩余油分布及其潜力,最后优选了二次开发调整方案。本文从水驱控制程度,注采对应率和油层动用程度等方面,综合评价了大港油田D区块的开发效果,经分区块分析得出大港油田D区块整体为三类开发水平。从井网
合同能源管理是目前一种先进的中央空调运行管理措施。介绍了合同能源管理的概念、特点,阐述了合同能源管理的类型及其运作程序,分析了合同能源管理在空调领域的应用空间,并
重金属离子污染是环境污染一大杀手。在众多污水处理的方法中,生物吸附技术是最常见且成本最低的方法,原因是生物吸附剂对环境友好并且易于大量获得。稻壳粉具有一定韧性、多
音频场景检测机制的主要任务是对一个含有多种音频场景的音频流进行自动标注,它综合了信号处理和模式识别等多项技术,在很多应用方面均占有重要地位,比如音视频的检索,也可作