向量DSP符号寄存器溢出的寄存器类间互用优化算法研究

来源 :湖南科技大学 | 被引量 : 1次 | 上传用户:carlos_yu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现代高性能DSP处理器具有非常优良的性能,特别是向量DSP处理器同时具有标量和向量处理单元。寄存器作为处理器硬件中有限的宝贵资源,寄存器分配成为编译器中最为关键的过程之一。当寄存器数量有限无法完全给那些寄存器分配候选者分配实际物理寄存器时,传统的方法是将符号寄存器的数据临时存放到存储器。这会增加对存储器的访存,降低代码的执行效率,也会产生额外的能耗。因此,提升寄存器分配效果的关键因素之一是降低溢出带来的访存开销。现代高性能向量DSP处理器往往具有多类寄存器资源,因此通过寄存器类间互用的方法来缓存某类符号寄存器的数据以降低符号寄存器溢出造成的访存开销是一个重要的优化途径。本文针对这个问题,结合向量DSP处理器的特点,以网为寄存器分配的对象,基于图着色的全局寄存器分配方法进行符号寄存器溢出优化算法研究。具体包括以下几个方面:1.处理单元内部的寄存器类间互用优化。在发生寄存器溢出时,考察是否可以将网溢出到某一个空闲的或者在某一个时间片空闲的其它类别的寄存器。遍历所有的网,分别找到并识别标量和向量处理单元的网,在两个处理单元分别进行网的溢出优化。确定网的溢出目标空间,再根据传统方法插入网的溢出和恢复指令,分别对标量和向量单元的溢出网进行溢出优化。一般来讲,相比于传统方法将网溢出到存储器,不同类寄存器之间的互用优化方法能提高代码执行速率。2.标量处理单元用SVR缓存溢出数据。SVR是标量单元和向量单元之间的通道寄存器。假设向量单元和标量单元没有同时使用SVR,此时只有标量单元可能占用这一组寄存器。当标量单元通用寄存器不够用,发生寄存器溢出时,查找在溢出网的生命期是否存在空闲的SVR来缓存这个网。在优化处理溢出网时,多个网可能缓存到同一个SVR,只要这些网的生命区间没有重叠。合理利用通道寄存器来作为溢出缓存,不仅加快了代码的执行速度、提高硬件资源的利用率,而且将网缓存到寄存器减小了处理单元对存储器的访存压力。3.向量处理单元用SVR缓存溢出数据。同样的假设向量单元和标量单元没有同时使用SVR,此时只有向量单元可能占用这个寄存器。虽然对向量单元来讲,只有一个SVR寄存器,只要这个寄存器在溢出网的生命周期空闲,仍然可以将网溢出缓存到这个通道寄存器,并且也存在多个网溢出到SVR寄存器的可能性,只要这些网的活跃周期没有冲突且SVR未被占用。对向量单元的网进行优化处理,将一组数据优化地溢出到寄存器,不仅提高了寄存器的利用率,还节省了大量的存储空间。
其他文献
2008年金融危机爆发后,为了缓解财政压力,加强对跨境纳税人的税收征管,全球联合打击跨国逃避税的决心促使跨境涉税情报交换工作正式进入了全面发展时期。在此背景下,完善我国跨境涉税情报交换制度,对于我国跨境税收征管与全球化经济保持一致至关重要。本文的主要内容共分六章,以中国跨境税收信息交换系统的现状为研究中心。主要讨论我国跨境涉税情报交换制度的实施中出现的问题和不足。第一章表明本文的选题背景、意义,介
目前,研究者在求解量子多体问题方面尚未取得令人十分满意的研究成果。我们通过对量子表象理论的研究,发现没有找到合适的表象是其主要原因。本文的目的是想通过研究表象理论
随着集成电路的体积不断减小和工作频率不断提升,对于集成电路封装的要求也愈加严格,其中对于集成电路封装技术提升的需求更加迫切。封装技术提升的同时,不同封装方式对保证
随着机器视觉技术近年来的快速发展,各种视频数据的急剧增加,使得基于视频数据的行为识别成为现如今的热点研究内容之一。本文设计的基于机器视觉的乒乓球动作分类与对比系统,重点研究将基于深度学习方法的动作识别技术应用于智能化乒乓球训练场景中,在缺少教练员评判的情况下,仅通过系统采集用户训练动作视频对其进行动作识别,分析用户技术动作的训练完成情况。本文设计的系统采用客户端/服务器端的设计架构,客户端数据采集
中江藤树作为江户时代的儒学集大成者,其对内涵深厚孝思想的儒家经典《孝经》的思想进行受容后,形成了极具特色的孝思想体系,在日本思想史上占据重要地位。熊泽蕃山作为其高徒,在对其孝思想传承的同时,也对其进行了发扬,形成了自己独特的孝思想体系。本稿在考察、剖析先行研究后发现,迄今为止的研究虽谈及孝的类型,但是忽略了孝涉及的诸主客体间的关系性决定其本质,而且没有整理出藤树基于《孝经》受容的基础之上所展开的孝
诚信是我们中华民族优秀的传统美德,是传统文化的重要组成部分,我们经常说我们中华民族素以诚信立足于天下,然而在当前的社会生活中,人们时常忽略了诚信的存在,个体也表现为缺乏诚信品质,失信严重损害了人与人之间的信任,对人们造成了无法忽视的心理损害;再者在经济交往中,人们由于过分追逐利益的最大化,就极易损害诚信的规则,致使社会存在着诸多知行脱节的现象,出现了一种新型的群体——道德失语症患者,道德失语症患者
目前许多大型结构越来越接近结构的寿命期限,如何了解结构的健康状态以便于进行结构寿命预估和改装加固等已经成为了目前亟待解决的难题。其中,选用合适的方法在不破坏结构的情况下掌握结构的损伤信息尤为重要。本文在众多研究者的成果基础上,基于L1正则化方法,选用测量的静力位移数据对结构进行损伤识别。主要研究内容如下:1、介绍了几种不适定问题的正则化解法。其中重点介绍了Landweber迭代正则化、Tikhon
在现代工业生产中,一个连接件经常需要多个螺栓进行紧固,在拧紧一个螺栓组时,螺栓之间弹性相互作用的影响会导致螺栓预紧力下降,最好的解决方法就是同时将一组螺栓紧固到期望预紧力。多轴螺纹同步拧紧除了要求对拧紧单个螺栓预紧力控制足够精准,还对拧紧多个螺栓时间上的同步性和多个螺栓之间预紧力的离散度提出了很高要求。针对此控制目标,本文选择易于实现且有国家相关标准参考的扭矩法作为拧紧工艺,对拧紧过程进行理论分析
随机过程模型是数理研究的重要领域之一,由于随机过程具有马氏性、独立性等重要特征因此对于准确的构建金融违约风险模型,在极端值及不完全数据下减少在刻划金融市场宏观稳定性强度参数指标的过程中产生的误差具有显著的作用。同时本文在一般强度违约参数模型的传染项因素中加入了违约累积次数的衰减性影响,降低了模型过度敏感的特征提高了模型的稳定性和抗干扰能力,使得模型在面对极端值或者尖峰厚尾分布的条件下对于平均违约到
近年来,由于多核处理器、云计算的大力发展,人们开始认识到调度算法的重要性。现今,单处理器环境下的任务调度算法已逐渐成熟,在各方面都有了广泛的应用。但我们若是为了贪图方便而直接将这些调度算法不加改变的转移到多资源环境下应用,最终效果可能不达预期。为了给科研人员提供一个较好的算法比较工具去帮助他们分析问题,我们尝试构建一个集工作流生成、数据分析、结果展示于一体的工作流调度模拟器VWGSim。VWGSi