基于DVFS技术的多核处理器性能和功耗预测模型研究

来源 :国防科学技术大学 | 被引量 : 0次 | 上传用户:liongliong427
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着半导体工艺技术的发展,处理器的片上资源不断增多。囿于单核结构难以通过资源的堆砌及主频的升高继续提高性能,且存在功耗升高过快的问题,多核处理器应运而生,并得到广泛应用。相对于单核处理器,多核处理器在一定程度上缓解了功耗问题,但效果有限。随着片上资源密度的进一步增加,功耗问题仍将变得越来越严重,成为限制处理器进一步发展的瓶颈。因此,功耗问题是当前多核处理器面临的首要挑战。动态电压频率调节(DVFS)技术和功耗门控(PG)技术是处理器产品用于调节性能和功耗的重要手段。DVFS技术通过改变处理器的频率和电压来调节处理器的性能和功耗。PG技术通过对供电进行门控来消除空闲处理器核的功耗,通常与线程迁移技术共同使用。本文探索了DVFS技术和PG技术对商用处理器性能和功耗的影响,并为其建立了性能和功耗预测模型。本文提出的模型具有良好的实用性,可在商用处理器平台上,应用于以DVFS和PG为手段的性能和功耗调整策略中。最后,本文以Power Capping场景为例讨论了模型的应用。本文取得的研究成果如下:1.提出了一种跨越DVFS等级的性能预测模型LL-MAB。LL-MAB模型是Leading Loads方法在商用处理器中的首次实现。根据AMD处理器Cache中MSHR部件的特点,利用处理器现有硬件事件,在程序执行过程中通过性能计数器统计Cache失效中所有Leading Load的累计时钟周期数。程序的执行时间包括计算时间和访存时间。通过Leading Load的总时钟周期数和处理器核的频率,可以得到访存时间。然后,通过执行时间和访存时间,可以得到计算时间。最终,通过访存时间、计算时间及其它各DVFS等级的频率,预测该程序在其它各DVFS等级的执行时间。LL-MAB模型具有易于实现的特点:无需进行数据拟合,且仅占用两个性能计数器。使用SPEC CPU 2006、PARSEC、NPB、Rodinia测试程序集,在Phenom-II X6 1090T、Opteron 4386、A10-5800K三款AMD处理器中进行实验,在2倍以上的频率差异下预测程序执行时间,LL-MAB模型的性能预测精度在94.7%至97.3%之间。2.提出了一种跨越DVFS等级的功耗预测模型PPEP。在多核处理器中,建立了适用于各个DVFS等级的功耗估算模型。功耗估算模型分为两部分,包括基于温度的空闲功耗估算模型和基于性能计数器的动态功耗估算模型。此后,依据两个实验观察(每条指令对应的各硬件事件计数值在不同的DVFS等级之间存在的若干相等关系),并将功耗估算模型和LL-MAB性能预测模型相结合,得到PPEP功耗预测模型。PPEP模型能够跨越DVFS等级预测处理器的功耗。在AMD FX-8320处理器中,以SPEC CPU 2006、PARSEC、NPB组成测试用例进行实验,在5个DVFS等级间相互预测各用例的平均功耗,预测精度为95.8%。3.提出了一种针对聚合多线程(CMT)体系结构的性能预测模型SCP。CMT体系结构是处理器中硬件多线程的一种实现方式,首先出现在AMD Bulldozer处理器中。在这类处理器中,两个硬件线程构成一个计算单元(CU)。不同于同时多线程(SMT)体系结构中所有计算资源都被各硬件线程共享,CMT体系结构为CU中的每个硬件线程保留了部分私有计算资源,包括定点计算单元、L1数据Cache等。此外的其它资源,如浮点单元、L1指令Cache、L2 Cache等,被CU中的两个硬件线程共享。执行程序时,若一个线程独占CU,则称为分离态执行方式;若两个线程分享CU,则称为聚合态执行方式。通过CU间的线程迁移,可以改变程序与硬件资源的映射方式,从而调节处理器的性能和功耗。本文利用性能计数器监测各线程对多种共享资源的使用情况,以线性回归方式建立SCP性能预测模型。当两个线程共享CU运行时,通过SCP模型可以预测它们各自独占CU运行时的IPC;反之,当两个线程各自独占CU运行时,通过SCP模型也可以预测它们共享CU运行时的IPC。在AMD FX-8320处理器中,对29个SPEC CPU 2006程序进行两两组合,验证SCP模型的预测精度。从分离态至聚合态的IPC预测精度为93.5%;从聚合态至分离态的IPC预测精度为93.8%。4.提出了一种适用于CMT体系结构、能够应对DVFS等级变化及CU间线程迁移的性能及功耗预测模型PPEP-SCP。PPEP-SCP模型通过PPEP模型和SCP模型融合而来,能够跨越DVFS等级,同时跨越线程的分离态与聚合态预测处理器性能与功耗。因此,基于PPEP-SCP可以建立能够同时利用DVFS、线程迁移+PG这两种处理器性能和功耗调节手段的策略。我们以Power Capping场景为例,建立了基于PPEP-SCP的Power Capping策略,该策略能够同时利用上述两种性能和功耗调整手段。同时,我们还建立了基于PPEP的Power Capping策略用于对比。实验表明,PPEP-SCP在利用DVFS的同时,还能通过线程迁移利用PCUPG技术来调节处理器性能和功耗。因此,基于PPEP-SCP的Power Capping策略相对于基于PPEP的Power Capping策略,能够使处理器实际功耗与目标功耗的吻合度更高,并获得更好的性能。
其他文献
给出了笛卡儿积图Pm×Sn,Pm×Fn,Pm×Pn,Pm×Wn,Pm×Cn的邻点强可区别的EI-全色数.
J·P·穆勒体操体系是近代欧洲灵肉体操流派的主要代表之一,对丹麦及世界体操的发展都做出了特殊的贡献。对近代欧洲"灵肉体操"流派的历史演进进行了梳理,并对穆勒的体育人生
采用厌氧区碳源分流多级A/O工艺进行了低碳、高氮磷市政污水的中试试验,研究了运行方式对该工艺去除有机物以及脱氮除磷的影响。通过7个阶段的连续运行比较,得到系统最优流量
目的:建立心可舒胶囊的质量标准。方法:采用薄层色谱法对心可舒胶囊中的丹参、山楂、木香、三七进行定性鉴别;并采用高效液相色谱法测定制剂中葛根素的含量。结果:薄层色谱中,供试
目前计算机向大存储量、高稳定性等方向发展。研究数据存储系统中磁头/磁盘间的超薄气膜的润滑动力特性和磁盘系统稳定性对高性能磁盘研发有重要意义。在纳米量级的超薄间隙
被动区加固方法常常被应用于深厚软土条件下的基坑工程,且能得到良好的控制位移效果。本文结合实际工程实例,运用MADIS-GTS的三维有限元数值模拟分析方法,从被动区加固宽度、加
虚拟集群技术的采用在提升硬件资源利用率的同时,也对存储系统的性能提出了很高的要求。一方面,作为虚拟机主要存储形式的稀疏镜像文件的引入,加重了存储系统的碎片化程度;另
地下水是京津冀地区重要饮用水源和战略资源,但随着经济社会的快速发展,京津冀局部地区出现了地下水重金属和有机物污染现象,严重威胁当地居民饮水安全。结合京津冀地区地下
根据国家电网公司建设“五统一”优秀企业文化的要求,国网浙江嘉善县供电公司西塘供电所积极开展国网企业文化基层站所本土化实践探索,融合嘉善公司“三善两美”企业文化建设
介绍风廓线雷达的历史、LAP-3000型风廓线雷达的基本原理以及深圳市LAP-3000型风廓线雷达的数据存贮格式、风廓线雷达产品的显示等内容;并给出了几种典型风场在风廓线上的反