【摘 要】
:
异构多核处理器为嵌入式系统的发展注入了新的活力,由于其集成了多种不同类型的处理核,能够满足多样化的应用需求。相比传统的同构平台,异构多核平台能够极大地提升系统的性能。然而,随着处理核数量和类型的增加,系统资源分配问题也变得愈加复杂。异构多核系统中的映射问题,抽象出来就是如何基于优化目标(性能、能耗等)将任务分配到处理核上,合适的映射方案能够极大地提升系统性能。通常,应用在执行过程中,程序不同的执行
论文部分内容阅读
异构多核处理器为嵌入式系统的发展注入了新的活力,由于其集成了多种不同类型的处理核,能够满足多样化的应用需求。相比传统的同构平台,异构多核平台能够极大地提升系统的性能。然而,随着处理核数量和类型的增加,系统资源分配问题也变得愈加复杂。异构多核系统中的映射问题,抽象出来就是如何基于优化目标(性能、能耗等)将任务分配到处理核上,合适的映射方案能够极大地提升系统性能。通常,应用在执行过程中,程序不同的执行阶段会呈现出不同的特征,并且不同类型的处理核在执行不同的应用程序时,性能也存在一定的差异性。因此需要根据系统动态变化的特征以及不同类型处理核的特点,对线程和处理核进行动态映射。此外,随着超大规模集成电路技术的更新迭代,多核芯片上集成的处理核数量逐渐增加,处理器的功率密度也随之提高。然而,不断增加的功率密度会导致芯片温度的升高,过高的温度可能会造成芯片不可逆转的损害(例如降低芯片使用寿命),并且系统为了降温,往往需要对处理核降频甚至是关闭部分处理核,这些措施会使系统性能无法达到原本映射方法的预期效果。为了让异构多核系统的优势得以充分发挥,提高系统的性能,本文基于两种主流的系统级功率约束进行线程到处理核的动态映射。本文首先提出了一种芯片级功率约束下的动态映射方法。考虑到不同类型处理核具有不同特征,进而适用于执行不同的应用程序,本文利用人工神经网络模型构建性能预测器,通过性能预测器评估应用程序在不同类型处理核上的执行效果,将线程与最佳的处理核类型进行匹配。然后用芯片级功率约束TDP(Thermal Design Power,TDP)对系统总功率加以限制,减少系统温度过热的情况。此外,为了进一步提升系统性能,本文提出了核心级功率约束下的动态映射方法。该方法考虑到系统中处于不同位置的处理核会有不同的热感受性(例如,处于中心位置的处理核会受到周围处理核更多的热传递),利用一种可以根据系统的温度阈值以及芯片上处理核的数量和位置为每个处理核计算一个统一的安全功率预算的核心级功率约束方法(即Thermal Safe Power,TSP),将经过线程-处理核类型匹配的线程映射到芯片上具体的位置,在满足安全功率的前提下最大化系统的性能。实验结果表明,与常见的轮询调度相比,本文提出的两类方法在解决热安全问题的同时,性能(平均每个时钟周期执行的指令条数)分别提高50%和53%。
其他文献
随着物联网的普及,用户设备群增多,通信的流量需求快速增长。这使得人们日益增长的通信需求和通信系统的最大容量之间的矛盾日益凸显。如何进一步提高无线通信的信道容量成为迫切需要解决的问题。作为未来6G关键性技术之一,智能反射面(Intelligent Reflecting Surface,IRS)协助无线通信技术被认为是一种能提高通信数据速率的有效方案,该方案不仅可以提高系统通信数据速率而且能大幅减少硬
随着万物互联的发展,边缘计算作为一种新的计算模式,能够弥补传统的云计算模式难以应对网络边缘产生的大量数据以及越来越高的延迟需求的缺点。近些年,随着人工智能第三次浪潮的推动,基于深度神经网络的应用程序在工业和社会上得到了越来越多的应用。边缘计算和人工智能的碰撞产生了“边缘智能”。在边缘智能中,加速模型推理一直是研究热点,其中模型分割作为一种新颖的技术,能够有效地减少深度神经网络的推理时间,但是在不同
随着信息技术的快速发展,数字系统对于时钟信号的要求越来越高。锁相环作为频率综合器的重要实现方式广泛应用于数字系统、数据转换器、无线收发器等电路中,其性能的好坏成为制约数字系统快速发展的首要因素,因此对锁相环抖动性能的要求也更加严苛。电路中的电源电压总会含有噪声成分,而电源噪声会恶化锁相环输出时钟的抖动性能,因此基于高电源噪声抑制能力的锁相环设计就具有重要的应用价值与研究意义。文章首先对电荷泵锁相环
粒毛盘菌属是一类腐生性真菌,在深层培养条件下能产生多糖、色素、多酚等多种活性物质。本文以粒毛盘菌YM38发酵液分离纯化的胞外多糖LEP-1a为研究对象,对其进行基本结构表征、模拟消化、化学修饰以及体内外生物活性研究。主要的研究结果如下:(1)采用HPGPC、IC、GC-MS、FT-IR和NMR等方法研究分析得出LEP-1a的分子量为5.69×10~4 Da,由半乳糖、葡萄糖和甘露糖组成,摩尔比为9
动脉粥样硬化是心血管疾病的主要病理之一,严重危害着人类健康,然而目前的临床治疗手段效果差强人意。作为现在最受欢迎的生活方式“间歇性禁食”,已有短期临床试验表明,其可以改善机体内促动脉粥样硬化危险因素,如:血脂水平、细胞因子等,但是严格的动物实验验证和具体的分子机制仍是未知的。本研究中我们喂食低密度脂蛋白受体敲除(LDLR-/-)小鼠高胆固醇食物,并进行间歇性禁食(正常喂食3天,禁食1天,循环7/1
随着半导体工艺的进步,电路的供电电压不断降低,电压域模拟电路的设计与优化愈发困难,集成电路的“数字化”已经成为一种趋势。先进集成电路工艺在时间域量化的精度已经达到皮秒级,随着工艺的发展,时间域量化的优势将愈发明显。时间数字转换器(TDC)用于测时电路,可以将输入的时间域信号转换为数字信号,在激光测距、量子物理、分子影像等诸多领域都有着广泛的应用,高精度、大测量范围时间测量技术已经成为当前的研究热点
随着5G时代的到来,“万物互联”的大趋势正在兴起。跟随这一趋势而来的是终端设备的不断增加,这使得网络中的数据量产生了爆炸性的增长。同时,大部分终端设备上的应用对时间延迟极为敏感。这意味着传统的云计算技术已经很难满足越来越高的用户需求,边缘计算因此诞生。然而靠近设备的边缘服务器所提供的计算资源是有限的。因此,对任务传输和卸载策略进行进一步研究,降低传输时延、平衡边缘计算网络中的计算负载有着重要的意义
MEMS扫描镜作为MEMS激光雷达系统的核心部件,是一种获取空间物体三维信息的微执行器。近年来,随着智能化汽车的快速发展,MEMS激光雷达逐渐成为智能驾驶汽车的核心传感器之一,并得到了广泛的关注和研究。车载激光雷达的应用环境对MEMS扫描镜提出了以下要求:要求具有较大尺寸的反射面积;要求在较高频率下运动(k Hz量级);要求具有较大的偏转角度。这些要求成为高精度和高分辨率MEMS扫描镜发展过程中亟
随着人工智能和物联网移动应用的快速发展,人脸识别、增强现实等新型应用被广泛地应用在各种移动设备中。然而移动设备受到体积、电池容量等因素的限制,难以满足新型应用对时延和能耗的需求。移动边缘计算技术的出现为解决该问题提供了新的方式,该技术将计算密集型的应用卸载到计算资源丰富的边缘服务器上执行,有效地降低计算任务的执行时延和能耗,提升运营商对用户的服务质量。但移动边缘计算技术在带来诸多优势的同时,也存在
合成孔径雷达干涉测量(Interferometric Synthetic Aperture Radar,In SAR)是一种主动式三维遥感测绘技术,它具有观测范围大、测量精度高,可以全天时、全天候对地面进行观测的优点,在数字高程重建、地表形变监测、冰川运动研究等领域具有重要的应用价值。为获得可靠的In SAR测量结果,需要对干涉数据进行高精度的处理。然而,由于干涉数据间失相干效应以及干涉相位周期性