流处理器相变存储器主存的性能优化

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:huawei_2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
单芯片多处理器的发展和应用不断增加的性能和精度要求,需要计算机的主存系统增加容量以保存更大的工作集。DRAM是过去的几十年里计算机主存系统采用的主流技术。但DRAM的工作原理决定了其可扩放性较差,且随着主存容量的扩展,DRAM的漏电流功耗在主存系统能耗中所占的比例逐渐和动态功耗持平。随着CMOS工艺不断向16nm的极限尺寸发展,处理器片上存储层次也需要新的存储技术代替存储密度较低而能耗较高的SRAM。以PCRAM和STT-RAM为代表的新型存储技术成为存储器系统方面的研究热点。PCRAM是非易失性的存储器,具有很低的漏电流功耗,PCRAM具有接近完美的可扩放性和数倍于DRAM的存储密度。虽然PCRAM在存储密度和漏电流功耗控制方面具备了代替DRAM的能力,但是要用PCRAM完全代替DRAM目前还需要在降低读写延时,扩展生命周期,控制动态功耗等关键技术方面进行改进。本文主要从三个方面进行研究:利用避免冗余位写技术延长PCRAM的生命周期,利用避免行缓存写回技术降低读写延时和动态功耗,并评估了访存调度算法对PCRAM性能的影响。主要研究内容和成果包括:(1)研究了PCRAM的工作原理,为PCRAM建立了抽象的性能模型,并将该模型用于模拟流处理器的主存系统。(2)研究了PCRAM的非易失性,并提出了利用该特性对PCRAM性能进行优化的新技术。采用避免冗余位写技术优化了PCRAM的可写次数,从而延长了PCRAM主存系统的生命周期;利用避免行缓存写回技术减少了无效写操作的次数,有效的弥补了避免冗余位写技术带来的性能损失,提高了PCRAM主存的性能同时降低了动态功耗。实验评测了以上两种技术的优化效果:避免冗余位写技术平均使PCRAM生命周期延长3.2倍,优化后的写操作能耗是原系统写操作能耗的42%。(3)通过对PCRAM存储技术特点和流处理器访存特征的分析,评测了不同访存调度策略对PCRAM主存性能的影响。对测试程序实验结果的分析显示,选择适合PCRAM技术特点的访存调度算法对程序性能有显著影响。
其他文献
时延容忍网络(DTN, Delay Tolerant Network)是从现实场景中抽象出来的一种网络结构,是在没有完整通信链路的情况下,完全依靠移动节点之间主动或者随机的接触,从而实现通信的
建立城市的智能交通体系是目前许多城市未来的发展趋势,但具体在机动车辆监督上仍然缺乏高效、准确的手段。因此,论文重点针对智能违章判别中的信息标定问题,围绕车道、信号灯这
随着以微电子、嵌入式以及无线通信技术为基础的无线传感器网络快速发展,体现出微型化,节点部署灵活,成本低等优点,为大坝安全监测提供了全新的解决方案,有着巨大的应用前景。由于
路由协议是无线传感器网络的核心技术之一,它设计的是否合理直接关系到无线传感器网络的性能,因此根据无线传感器网络的特点和应用环境,设计专用的路由协议已经成为了当前无
虚拟实验是虚拟现实技术在教育领域的重要应用。虚拟实验是指通过计算机、网络设备等模拟教学中的各种实验。虚拟实验可以弥补教学设备的不足,是辅助教学的重要手段。虚拟实
学位
全球化的时代背景下,企业的产品设计和制造模式渐渐从独立开发转向企业间协同工作,传统的产品数据交换和共享方式已不能满足发展需求,支持产品模型定义交换的STEP AP242协议已经
随着三维扫描获取技术的发展,数字几何媒体已经在工业制造、生物医药、数字娱乐、数字文化遗产保护等方面取得了广泛的应用,数字几何处理技术,特别是基于网格(Mesh)模型的数
人体内分泌系统是一个复杂的分布式自适应系统,该系统具有在高层对神经系统的调控作用、功能情感反应、自组织、分布式处理等一系列独特的功能。内分泌系统的上述功能,能够使
网格计算是伴随着互联网技术的迅速发展而产生的一种新型分布式计算模式,以实现大规模分布式资源共享及协同问题求解为目标。任务调度是网格计算的一项核心技术,高效的任务调