面向软件管理片上存储器的编译优化技术研究

来源 :国防科学技术大学 | 被引量 : 0次 | 上传用户:jianfei
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于处理器性能和存储器性能的巨大差异,导致了“存储墙”问题的出现,使得存储系统成为系统的瓶颈。传统计算机体系结构均采用硬件管理的cache来解决存储墙问题。然而,随着应用和工艺的发展,Cache逐渐暴露出一些问题。相比之下,软件管理的片上存储器以其面积、功耗和访问时间等方面的优势,被认为是解决存储墙问题的一个有效途径。目前,软件管理的片上存储器已被普遍运用于嵌入式系统、流处理器和图形处理器中,并被逐渐运用到新型高性能计算机体系结构中。与硬件管理的cache不同,软件管理的片上存储器需要由软件通过数据传输语句显式地管理所有片上与片外存储器之间的数据传输,决定数据进入存储器的时机和位置。软件管理的片上存储器给编译提出了重要的挑战。如何在保证程序正确性的基础上,尽可能提高有限的片上存储器空间的利用率,尽量避免存储器碎片;充分捕获数据复用,优化存储层次间的通信,从而最小化存储器带宽需求;开发计算与访存并行,有效隐藏存储器访问延迟,是提高基于软件管理片上存储器的系统上程序性能的关键。本文重点研究了面向软件管理片上存储器的编译优化问题。本文的主要工作和创新概述如下:(1)提出了基于置换图着色的便笺存储器分配算法。现代嵌入式系统中,广泛地将片上存储器组织为软件管理的便笺存储器(Scratchpad Memory, SPM)。本文深入研究了面向嵌入式应用的SPM分配问题,首次发现了大部分嵌入式应用的相干图(Interference Graph)为置换图(Permutation Graph),从而能在线性时间内获得最优的SPM分配。本文首次提出了一个基于置换图着色的SPM分配算法。理论分析和实验表明,基于置换图着色的SPM分配算法与国际上最新的基于超完美图(Superperfect Graph)的SPM分配算法相比,流程更简洁,复杂度更低,性能更优。(2)提出了基于存储器着色的流寄存器文件分配框架。流体系结构是一种新兴的面向流应用的高性能计算机体系结构。流体系结构采用软件管理的片上存储器,称为流寄存器文件(Stream Register File, SRF),作为数据的核心存储部件。SRF是不可旁路的存储层次,软件必须保证计算需要的输入流提前加载到SRF中,并为输出流分配足够的SRF空间。优良的SRF分配方案还应能在避免引入额外的片外存储器传输的前提下,有效地捕获流应用中广泛存在的生产者消费者局部性,并尽可能地开发计算与访存并行。本文提出了一套基于存储器着色(即存储器划分加上图着色寄存器分配)技术的SRF分配框架。本文研究的新颖之处在于将开发重用和并行巧妙地整合到传统的图着色寄存器分配框架中。此外,针对应用的特点,本文对传统的图着色寄存器分配技术做出了一些改进,如提出了渐增的联合技术,寄存器排序技术。实验表明基于存储器着色的SRF分配框架能够在不引入溢出的前提下,有效地开发复用和并行。(3)提出了基于最佳有向路径寻找的流寄存器文件分配算法。基于存储器着色的SRF分配框架能够有效地开发复用和并行。但是,存储器着色技术在划分SRF以及对相干图进行着色时有一定的缺陷,容易引入SRF空间浪费。本文的另一个研究重点是在相干图确定的情况下(即操作流相干图开发复用和并行后),如何最小化需要的SRF空间,避免引入存储碎片。本文首次发现了大部分的流应用的相干图为可比图(Comparability Graph),或可以降解为多个可比子图,从而能够获得多项式时间的最优SRF分配。本文首次将SRF分配问题建模为最佳有向路径寻找问题,提出了一个新颖的SRF分配算法。严格的理论分析和大量的实验表明,我们的算法能获得最优或近似最优的SRF分配。相对目前普遍采用的基于First-Fit的启发式算法,我们的算法具有更好的性能。(4)提出了基于层次图着色的软件管理多级存储层次分配算法。现代的高性能计算机体系结构中,为了更有效地实现计算与访存的平衡,优化访存带宽和延迟,越来越多地采用软件管理的多级存储层次来替代硬件管理的多级cache存储层次。传统的编译优化研究大都面向单一存储层次,缺乏对存储层次全局的综合考虑,对存储层次间通信等的优化不足。而最小化存储层次间的通信,能大大减少存储器带宽需求,是影响性能的一个重要因素。本文扩展了图着色寄存器分配算法,首次将其运用到多级存储层次分配上。通过将存储层次建模为一个带权图,我们的方法可以运用到任何多级软件管理存储层次组织上。我们对传统数据相干图进行扩展,提出路径合并和路径消解技术,有效地减少存储层次间通信。通过数据生存期扩展技术,还能有效地进行计算与访存并行的开发,从而隐藏存储访问延迟。以上的优化都跟扩展后的图着色寄存器分配框架巧妙地整合在一起。实验表明,我们的算法有良好的性能。
其他文献
器件工艺技术的发展、系统规模的扩大以及异构系统的兴起在不断提高高性能计算机性能的同时,也带来了越发严重的可靠性问题。可靠性问题已经成为制约高性能计算发展的重要因素
德州学院近年来实验需求呈现出多样化特征,实验课程在各专业教学体系中逐步占据重要地位,同时对本校实验室管理工作提出更高要求。当前该校实验室管理体系中以传统模式为主导,实验预约效率较低;针对学生在实验课程中的表现难以掌握,实验课程质量受到影响,难以达到预期课程目标;另外针对实验室仪器的管理也停留在初级阶段。德州学院以优化实验室管理体系为目标,决定开发实验室管理系统。德州学院实验室管理系统设计过程中引用
绿色计算是当前高性能计算领域最为关注的话题之一,降低系统功耗、提高系统效能是维持超级计算机向更大规模系统发展的重要途径。异构并行系统已成为当前高性能计算机系统发
根据省局提出的"事企区别运行又相互促进"的总体要求,为适应地勘队伍改革发展的需要,解决现行体制和机制不相适应及弥补事业拨款不足等问题,加快发展方式的转变,在保留地勘单位
随着互联网技术的不断深入,人们的生活和工作也发生了巨大的变化,以往企业和单位的财务管理工作一直保持使用纸质形式,而现在财务管理工作实现了无纸化办公,财务管理工作也面
终止游戏与继续生存──先锋长篇小说论谢有顺文学进入九十年代之后,一批年青的先锋小说家先后抛出各自精心结撰的长篇巨制,向我们宣告了先锋小说第二次高潮──长篇小说创作时
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
中国共产党成立95周年即将到来之际,位于北京市东城区五四大街的北大红楼,再一次成为人们游览参观的热点。与周边建筑相比,她没有故宫博物院的宏伟壮丽,也没有景山公园的树木
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield