异构多核SOC处理器内部存储架构优化

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:iserce
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着异构多核技术的发展,微处理器的性能得到了提升,处理器与外部存储器之间的带宽差异严重限制了处理器的性能发挥。本文针对一种用于高密度计算的异构多核So C系统,优化了存储设计方案。该方案通过复用一些网络中闲置的空闲存储资源作为二级共享缓存来增加访存带宽,降低对外部存储器访问频率;同时分布式高速共享二级缓存结构通过结合多路并行访问外部存储的层次化存储结构,缩短系统处理数据与外部存储器间的速度差异,提高数据的存取效率,优化系统的性能。本文的主要工作内容如下:1.针对异构多核系统的访存特点与数据存储需求,本文设计了一种能够复用本地的空闲存储资源用作二级缓存的层次化存储结构。该结构将网络系统中的闲置功能单元的存储资源进行统一编址,在逻辑功能上为共享存储结构,而在物理结构上为分布式存储结构,将统一编址管理的存储块用作二级缓存为其他运算节点存取数据。这种分布式缓存、集中式控制的结构节省了片上存储资源,减小面积,缓解存片内外存储速度不匹配的问题,提升了系统的访存性能。2.根据设计方案,本文对分布式共享缓存结构进行硬件设计,对缓存的整体硬件架构进行介绍,并根据功能的不同分出主要的功能模块,包括缓存控制模块、数据缓存模块、片上网络通讯模块和多路数据并行传输模块等;对功能模块进行介绍,包括工作原理、硬件的架构设计和工作的流程等;对功能模块的数据通道进行了介绍,包括两大类数据通道的设计实现和工作流程等。3.本文将分布式高速共享缓存结构集成到目标系统异构多核系统上,构建测试平台,加载不同类型的任务,定义性能指标,验证该结构功能并对资源消耗和性能进行评估。最终实验结果表明,该结构与无缓存结构相比在单一模式下任务平均性能提升了40.6%,流模式任务的平均性能提升了13.3%。综上,本文设计的分布式共享缓存结构能有效提升系统性能。
其他文献
随着云计算和安全多方计算等技术的发展,相关技术涉及的数据安全和隐私保护问题也日益凸显。全同态加密可以在无需密钥的前提下对密文进行任意操作,从根本上解决了云计算过程中所面临的数据安全和隐私保护问题,这使得全同态加密具有重要的理论意义和应用价值。基于环上带错学习(Ring-Learning With Error,RLWE)的密码方案具有结构简单、抵抗量子攻击等优点,这使得基于RLWE的密码学成为密码学
合成孔径雷达(Synthetic Aperture Radar,SAR)具有全天候、全天时的特点,并且可获取高分辨率的地表图像。然而相干斑噪声影响了SAR图像的应用,因此SAR图像去噪成为了遥感图像处理中的一个重要研究方向。传统的去噪方法具有一定的局限性,无法有效实现去噪能力与结构保持之间的平衡。随着深度学习方法的不断发展,卷积神经网络(Convolutional Neural Network,C
基于全同态加密方案的机器学习可以有效解决因共享敏感数据带来的隐私保护和合法性问题。但原文经过加密之后,密文的数据位宽达数百万位,因此大整数乘法单元成为了加密神经网络训练和推理的基本工具。此外在航空航天等高端应用场合,利用大整数的高精度运算特性,将浮点数的尾数替换成大整数,可以有效解决浮点数运算精度不足的问题。因此,为了提高上述应用的性能,针对大整数乘法器进行创新设计是非常有必要的。本文的主要工作如
移动通信技术的迅猛发展促使通信需求的急剧增长,带来了对通信的数据速率和时间延迟的更高要求。与此同时,通信设备能耗的急剧增加也带来了绿色通信的迫切需求。为了支持日益繁荣的移动通信应用和实现无线通信系统的可持续发展,设计有效的低时延与低能耗的传输方案成为产业界和学术界的热点研究问题。本文分别从低时延与低能耗的角度,针对异构无线网中的常见场景,研究了采用全双工中继的低时延的云无线接入网(Cloud Ra
超声多普勒技术在临床医学实践中有着广泛的应用,如超声多普勒胎儿心率测量、超声多普勒血流速度测量、超声医学成像等。在传统的超声多普勒系统中,超声回波信号的解调多采用正交解调的方式,但是正交解调电路复杂,对外围电路要求高,而且数据处理的数据量大。针对正交解调存在的问题以及提取更为精确的超声多普勒频移信号,本文设计了一种单通道乘法器解调电路。本文的主要工作如下:1、提出了一种用于超声多普勒回波信号解调的
5G通信技术的快速发展和应用,加快了整个社会的信息化和智能化进程。作为智能交通系统(Intelligent Traffic System,ITS)重要组成部分的车载自组织网络(Vehicular Ad-hoc Networks,VANETs)也随之演进,表现为车辆的信息化、网络化和智能化程度越来越高。在此过程中,越来越多的计算密集型车辆应用不断涌现,对车辆自身有限的计算资源提出了严峻的挑战。为此,
预取技术通过提前将处理器所需的数据获取到缓存中,可以有效的隐藏内存访问延迟,但预取可能会给正常的缓存访问带来负面影响。此外,随着处理器从单核处理器发展到多核处理器,使得多个核心竞争最后一级共享缓存,缓存争用给预取技术带来了巨大挑战。对于多样化的应用程序工作集,如何既可以使用预取来隐藏内存访问延迟,又可以减少由于共享缓存竞争而导致的核间干扰成为热点问题。根据程序在运行过程中发出访存指令的频率,可以将
在日常生活中常用的液晶显示器主视角都是正视方向,然而在某些特殊的场合中,比如飞机、火车、汽车驾驶舱内,由于显示器的安装位置和角度的限制,显示器的主视角方向与人眼观看方向存在一定的夹角,这将导致观看效果不佳并且还会造成光能的浪费。为了解决这一问题,本文提出了一种基于扩展光源的视角偏转膜表面微结构设计方法,设计出了不同偏转角度的视角偏转膜,满足了不同应用场合下的视角偏转要求。首先提出了扩展光源离散化设
近年来,随着移动数据业务量爆炸式增长,下一代的无线通信技术面临着频谱资源匮乏、通信信息安全等重大挑战。全双工技术因其支持设备的同频同时收发数据已成为迎接这些挑战的关键技术之一。为了提升无线频谱效率,研究了全双工无线局域网中的传输调度方案来提升网络效用;为了增强主动侦听性能,研究了结合导频污染技术的全双工主动侦听方案以实现有效的信息侦听。具体研究内容和主要贡献如下:(1)在采用全双工接入点(Acce
目的:咪唑型离子液体(ILs)应用广泛,但易在环境中蓄积并产生毒性。因此,研究ILs的毒性及其作用机制显得尤为重要。本文以大鼠为实验对象,采用经口染毒的方式,评估了咪唑型ILs四氟硼酸化1-十四烷基-3-甲基咪唑盐([C14mim]BF4)对大鼠的急性毒性,并在此基础上,研究了[C14mim]BF4亚慢性染毒对大鼠肝脏抗氧化系统和炎症反应的影响,探讨其毒性作用的分子机制。方法:1)急性毒性:实验采