基于程序中数据流访存模式的硬件预取技术的研究

来源 :安徽大学 | 被引量 : 0次 | 上传用户:kalok
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自20世纪70年代以来,处理器的研发趋势始终关注如何提高内核中指令的执行效率,而主存储器却主要聚焦于存储容量的增大,忽略了速度的提升。处理器与主存发展趋势的不同,造成了两者之间访存速度难以匹配,直接导致了影响计算机性能的“存储墙”问题。为了试图弥合处理器与主存之间的速度差,计算机架构师们普遍采用在系统中插入多级缓存的层次型存储结构。然而,缓存的容量与主存相比毕竟有限,访存期间一旦出现缓存缺失,就会带来很大的不命中处罚延时,从而造成处理器访存的停滞。在发生缓存缺失的背景下,能够预测处理器下一个访存操作所需信息,并将该信息预先取回的预取技术就具有极高的工程研究前景与现实应用价值。预取技术具有设计可行性高、硬件开销较低以及应用范围广等优势,经过多年的发展,其已经被证明是隐藏处理器与主存之间访存延时的一种行为有效的手段。为了提升系统中程序的运行效率,降低处理器访存延时,本文提出一种在处理器工作时检测并识别程序中数据流访存模式的硬件缓存预取策略。全文首先介绍了现有预取策略的特性并总结了各自的优缺点,紧接着对内存中程序访存行为特征进行了分析,如地址翻译方式、局部性原理、程序中基本访存模式等,同时还结合了程序实例探讨了预取技术所能带来的性能优化。然后给出了本文硬件预取方案中的预取地址结构、预取部件的位置、结构与组成,并详尽阐述了各个预取子模块所要实现的功能与工作原理。本文预取策略设置了多个数据流预取条目,以此达到识别并记录多个数据流的能力。同时,该策略还对程序中的顺序数据流与跨步数据流进行分开独立检测,最大限度避免了不同步长数据流之间的干扰,也提升了预取部件的准确性与效率。此外,为了防止预取请求影响正常指令的执行操作,本文还设置了预取请求缓冲暂存生成的预取请求,并制定了预取请求仲裁上访存流水线的优先级方案。最后,在国产自主指令集架构处理器中完成本文预取部件的实例化,形成性能评估所需的完整处理器模型。使用SPEC CPU2006作为测试程序,并在硬件仿真加速器上进行实际仿真测试。结果表明,本文基于程序中数据流访存模式的预取策略在程序运行期间能够有效提升处理器的执行效率,增加各级缓存的命中率,最终实现降低处理器与主存之间访存延时的目的。
其他文献
激光自混合干涉法作为一种非接触式光学传感测量技术受到航天、生物医疗、自动驾驶以及自然灾害预防等领域专家的广泛关注。与传统双光束干涉方案相比,激光自混合技术具有结构简单、光路易于准直、灵敏度高、测量距离不依赖于光源的相干长度等优点,可实现远距离非合作目标物理量的测量。特别是激光自混合测量技术与外腔频移技术相结合可加强反馈光与腔内激光的干涉强度与频率,进一步拓展了激光自混合测量方案的应用领域。近年,基
金属-氧化物-半导体场效应晶体管(Metal-Oxide-Semiconductor Field Effect Transistor,MOSFET)的特征尺寸随等比例缩小规则不断减小,导致其亚阈值摆幅、电流开关比等性能变差,由其构成的静态随机存储器(Static Random-Access Memory,SRAM)的静态功耗较高,阻碍了其在低功耗设备中的应用。而隧穿场效应晶体管(Tunnel Fi
激光测风雷达已经逐渐融入人类的生活,在天气预报、航天航空安全和智能风电等领域都有着广泛的运用。相比于传统的微波测风雷达,激光测风雷达使用波长更短的光源,因此更容易在微小的气溶胶粒子上产生米氏散射,从而可以有效探测晴空条件下的风场信息。在已有的各类激光测风雷达中,使用1550nm激光的全光纤结构连续波激光相干多普勒测风雷达拥有一些特别优势,如人眼的最大允许曝光量较高、结构简单、关键器件的成本低、可靠
随着移动通信网络技术的发展,越来越多的移动设备接入到通信网络中,在一定程度上加重了回程链路的负载,同时,用户对数据传输速率的要求也越来越高。可以通过在网络中引入缓存技术来减轻回程链路的压力,提升网络的整体性能。网络缓存需要考虑缓存内容和缓存位置两方面的问题,只有准确地将用户的兴趣内容放置在用户的关联基站上,才可以在满足用户需求的同时有效地减轻回程链路的压力。论文的主要研究内容如下:首先,考虑移动蜂
随着机器学习、图像识别、物联网等新兴领域的发展,在处理像基于大数据的计算任务时,传统计算架构已经越来越不能满足快速发展的应用对处理器速度和能量效率的要求。存内计算不同于传统的计算架构,它将系统的存储模块和计算模块相结合,使系统对数据的处理步骤可以直接在内存中完成,实现了存储和计算一体化。存内计算节省了数据从存储模块到计算模块之间的传输,不但大大地节省了能量消耗,也进一步提升了数据的处理速度。静态随
在无源定位中,利用观测站获得目标信号的到达角(Angle of Arrival,AOA)、达到时间(Time of Arrival,TOA)和到达时间差(Time Difference of Arrival,TDOA)等测量值,可以确定目标的位置。有研究人员通过引入到达频率差(Frequency Difference of Arrival,FDOA)测量值,使得基于TDOA和FDOA的定位算法可以
随着无线通信技术不断进步,近年来,天线逐渐朝着小型化、宽带化以及多天线化等方向发展,超宽带(Ultra-Wide Band,UWB)技术以其高功率高效率的数据速率、低复杂度、低成本和高精度等显著特点被广泛应用于端对端无线通信。然而,UWB系统在信号传输过程中,会遭受由信号反射和衍射从而引起的多径衰落效应。而与UWB相结合的UWB-MIMO无线通信系统不仅解决了单个多输入多输出(Multiple I
存储器是当今集成电路产业中的核心部分,随着半导体行业的迅速发展,人们对存储器的要求也越来越高。传统的闪存类存储器由于尺寸过大,不能满足现如今20nm的集成需求而逐渐被其他新型存储器所替代。其中电阻式随机存取存储器(resistive random access memory,RRAM)被认为是一种有很大发展潜力的新型非易失性存储器。RRAM的集成方式一般是采用集成度最高的十字交叉阵列结构。可是RR
当前基于冯·诺依曼架构的计算系统受到内存、功耗、带宽等方面限制,人们试图开发新的架构方式,以避开这些限制。其中,存内计算由于可在阵列中处理数据,降低了对内存带宽的要求,从而节省了能源,因而被广泛研究。通过阅读文献可以发现,目前SRAM存内计算通常采用两种读取方式。第一种是多行读取,具有并行性高的优点,但由于采用模拟计算可能会导致其读出的数据存在误差,难以满足一些对精度要求较高的应用。另一种方法是单
近年来,为了解决“最后一公里”配送中存在的成本高和效率低的问题,众包物流和无人机配送物流已经成为研究热点。众包式无人机配送系统结合众包物流和无人机配送物流的优势,不仅能够有效地整合无人机资源,使具有无人机配送需求的小型配送站无需购买大量的无人机,而且能够提高配送效率和降低总的配送成本。然而,现存的众包系统一方面未考虑无人机配送任务的特殊性,另一方面普遍采用中央服务器作为众包平台,容易出现单点故障、