异构多核处理器多发射动态调度主控制器研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:caritasSD
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着处理器的发展,仅仅依靠处理器的单核性能来提升整体性能已经遇到了瓶颈,多核处理器的计算并行化是现在以及将来研究的热点,如何合理调度所有的计算单元,使得系统的计算能够并行化展开,提升计算单元的利用率将是提升多核处理器计算性能的关键。围绕上述问题,本文设计了一种面向异构多核计算系统的动态任务调度控制器。通过对系统计算行为的分析,主要实现了动态监控计算单元的负载情况、动态任务唤醒、任务并行性自动提取、任务乱序多发射、任务写回安全管理等功能。研究了一种降低计算任务结果数据写回DDR外存储器次数的方法,大幅节省了访存开销,进一步提升了计算性能。本文探讨了任务指令的取指、调度、发射、写回、唤醒过程和相应的硬件电路结构,并完成了仿真测试。仿真与测试显示,在典型应用场景下,与原有的无动态调度功能的任务发射控制器相比,实现了显示并行化编程向任务并行的自动化控制过渡,编程友好度显著提高,在不同案例下,分别提升了11.3%~37.9%的计算性能。本文使用现有的以片上网络为通讯载体的异构多核异构计算系统作为目标平台,对于如何充分发挥计算系统的计算性能进行了深入研究。本文的主要工作如下:1.深入分析了原有的多核计算平台的特征和工作流程,以及在运行大量计算时的性能瓶颈,针对原有的异构多核计算系统只能按照预先编写的程序指令顺序执行的问题,研究了硬件自动提取任务间并行性和实时动态任务调度的基本原理和方法,研究了一种面向目标计算平台的动态任务调度和任务乱序发射解决方案。2.结合目标计算平台的具体工作流程,定义了任务的概念和任务划分方法,设计了用于记录任务基本属性和任务之间数据依赖关系的任务依赖关系表,任务依赖关系表还包含了用于控制任务执行流程的额外指示信息,这些信息共同组成了调度控制器调度任务时的依据。在该前提下,研究了一种能够支持实时动态任务调度和乱序发射的主控制器的硬件设计方案。通过读取任务依赖关系表的信息,追踪任务之间的数据依赖关系以及任务所需的计算资源消耗,通过状态网监测目标片上网络计算平台上计算单元的繁忙状态,确定可供调度的计算单元数量,从而实现对任务是否满足发射条件的动态监测,为动态任务调度和乱序发射提供基础。3.完成了针对现有目标计算平台的编程配置程序的动态更新-发射的设计,通过对任务占用的计算节点坐标在调度时的动态重新映射,解决了现有目标计算平台只能在编程时静态指定计算节点坐标的问题,增加了编程时的灵活性。在任务的动态映射策略上,考虑使用最邻近算法,将任务发射到离产生任务所需的源数据的计算单元最近的计算单元上,降低了节点之间的数据传输链路的延迟。同时使用预备队列的方式,提前将任务的后继任务所需的计算节点准备完毕,提供多个可选择的目标节点,隐藏了搜寻系统上空闲计算单元的时间,提升了任务映射的效率。4.针对任务在计算完成时是否将结果数据强制写回DDR存储区和任务是否与其他任务组成任务链的需求,定义了四种任务类型,通过动态的让任务与任务组成任务链条的方式和任务能发尽发的策略,提高了计算单元的利用率,并减少了任务写回DDR存储器以及从DDR存储器读取数据的次数,提高了计算密度,减少了访存时间消耗,提升了目标计算平台的计算性能。5.在动态组成任务链以减少任务写回DDR存储器次数以及任务能发尽发的基础上,针对原本只能将结果数据写回DDR存储器的任务,开辟系统上的空闲节点作为临时暂存,用于存储任务的结果数据,进一步减少了任务写回DDR存储器和从DDR存储器读取数据的次数,节省了大量的访存时间,进一步提升了目标计算系统的计算性能。6.针对任务之间可能存在的复杂数据传递关系,例如任务具有多个前驱任务或者具有多个后继任务,研究了一种对于复杂任务图和简单任务图均适用的数据安全管理机制。7.面向目标计算平台,在调度控制器硬件实现完成后,构造了多种测试集,映射了不同特点的应用程序,测试了在使用动态调度控制器后,计算应用程序的总体运行时间等指标,通过与无动态调度控制器的已有目标平台的总体运行时间等指标对比,得到了动态调度控制器带来的系统整体性能提升效果,验证了调度控制器的方案可行性和功能正确性。
其他文献
随着5G时代的到来,“万物互联”的大趋势正在兴起。跟随这一趋势而来的是终端设备的不断增加,这使得网络中的数据量产生了爆炸性的增长。同时,大部分终端设备上的应用对时间延迟极为敏感。这意味着传统的云计算技术已经很难满足越来越高的用户需求,边缘计算因此诞生。然而靠近设备的边缘服务器所提供的计算资源是有限的。因此,对任务传输和卸载策略进行进一步研究,降低传输时延、平衡边缘计算网络中的计算负载有着重要的意义
MEMS扫描镜作为MEMS激光雷达系统的核心部件,是一种获取空间物体三维信息的微执行器。近年来,随着智能化汽车的快速发展,MEMS激光雷达逐渐成为智能驾驶汽车的核心传感器之一,并得到了广泛的关注和研究。车载激光雷达的应用环境对MEMS扫描镜提出了以下要求:要求具有较大尺寸的反射面积;要求在较高频率下运动(k Hz量级);要求具有较大的偏转角度。这些要求成为高精度和高分辨率MEMS扫描镜发展过程中亟
随着人工智能和物联网移动应用的快速发展,人脸识别、增强现实等新型应用被广泛地应用在各种移动设备中。然而移动设备受到体积、电池容量等因素的限制,难以满足新型应用对时延和能耗的需求。移动边缘计算技术的出现为解决该问题提供了新的方式,该技术将计算密集型的应用卸载到计算资源丰富的边缘服务器上执行,有效地降低计算任务的执行时延和能耗,提升运营商对用户的服务质量。但移动边缘计算技术在带来诸多优势的同时,也存在
合成孔径雷达干涉测量(Interferometric Synthetic Aperture Radar,In SAR)是一种主动式三维遥感测绘技术,它具有观测范围大、测量精度高,可以全天时、全天候对地面进行观测的优点,在数字高程重建、地表形变监测、冰川运动研究等领域具有重要的应用价值。为获得可靠的In SAR测量结果,需要对干涉数据进行高精度的处理。然而,由于干涉数据间失相干效应以及干涉相位周期性
异构多核处理器为嵌入式系统的发展注入了新的活力,由于其集成了多种不同类型的处理核,能够满足多样化的应用需求。相比传统的同构平台,异构多核平台能够极大地提升系统的性能。然而,随着处理核数量和类型的增加,系统资源分配问题也变得愈加复杂。异构多核系统中的映射问题,抽象出来就是如何基于优化目标(性能、能耗等)将任务分配到处理核上,合适的映射方案能够极大地提升系统性能。通常,应用在执行过程中,程序不同的执行
机器对机器(Machine to Machine,M2M)通信以全机械自动化的环境为基础,通过有线或无线链路接入智能设备,使其无需人工直接干预即可互联互通,是下一代通信系统中一项很有前途的技术,广泛应用于智能电网、公共监控、智慧交通、电子医疗保健等领域。目前,M2M主要依靠传统网络进行通信,而传统网络起初是服务于人对人(Human to Human,H2H)设备通信的,又因M2M与H2H通信系统之
伴随现代导航技术的飞速发展,中国自主建设了北斗卫星导航系统,可为全球范围内的军民用户们提供海、陆、空导航定位和授时服务,北斗卫星导航系统的建立快速推动了中国的安全和经济发展等领域的发展。在北斗的高精密定位中,载波相位差分是主要的一种定位方式,主要依赖于载波相位观测值,而周跳是载波相位定位过程中常常遇到的问题,周跳的发生将使载波相位观测值发生变化,大大降低定位精度,因此准确地探测和修复周跳对北斗卫星
作为高精度探测仪器,有源相控阵雷达的阵面天线均能独立收发电磁波,因而有源相控阵雷达能够高效、准确、稳定地探测和跟踪目标,使得它在军事、导航和通信等领域中拥有极其重要的作用。有源相控阵雷达在工作时,由于天线热源的热功耗使得阵面发生热变形,一定程度上恶化了雷达的馈电性能,因而对雷达热变形的仿真预测和补偿研究是提高雷达性能的重要措施之一。采用传统有限元仿真由于并未考虑结构的形体边界约束带来的非相似性热变
伴随着互联网技术的快速发展,基于定位的服务已经融入了我们的生活,变成日常生活中不可缺少的一部分。而随着移动设备的快速更新,许多的移动应用也嵌入了定位功能。在室外环境下,北斗定位系统,全球定位系统(GPS),伽利略系统等等基于卫星信号和雷达的定位技术已经非常成熟,并且由于具有抗干扰能力强,精度高,实时性好等特性,这些定位系统已经可以满足广大人民的日常生活需求。但是在人们经常活动的室内环境中,GPS等
随着集成电路技术的发展,工艺制程逐渐逼近极限,单核处理器已经进入了瓶颈期,多核处理器应运而生,受到了广泛的关注。任务调度算法是多核处理器并行计算能力能否充分发挥的关键因素之一。在对现有多核处理器静态任务调度算法广泛研究的基础上,以基于复制的任务调度算法作为研究对象。针对现有算法中存在的关键路径估算误差较大、解空间搜索不充分等问题,分别提出了面向异构多核处理器的带资源约束的任务复制调度算法TDSA-