面向SIMD的向量化算法及重组技术研究

来源 :解放军信息工程大学 | 被引量 : 17次 | 上传用户：xhg123456

【摘要】

：

随着多媒体应用的普及，越来越多的处理器集成了SIMD扩展，并且随着SIMD扩展对浮点运算支持的完善，SIMD扩展部件被更多地应用于高性能计算领域。由于不同SIMD扩展提供的向量化指令

【作者】

：

魏帅

【出处】

：

解放军信息工程大学

【发表日期】

：

2012年01期

【关键词】

：

SIMD RLRSLP ISGSLP 多重循环向量化辅助优化数据重组向量重组

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着多媒体应用的普及，越来越多的处理器集成了SIMD扩展，并且随着SIMD扩展对浮点运算支持的完善，SIMD扩展部件被更多地应用于高性能计算领域。由于不同SIMD扩展提供的向量化指令差异较大，与底层硬件关系密切，使得难以依靠程序员手工编写向量化代码，而是更多地依靠编译器自动实现向量化功能，比如Gcc、Open64以及Icc等编译器都提供了自动向量化功能。目前主流的向量化方法有两种，传统向量化着眼于循环迭代间的并行，而SLP则对循环内基本块中的语句进行组合，这两种向量化方法各有优点和弊端，只有将两种向量化方法结合起来才能更好地进行向量化，其次对内存数据的非对齐和非连续访问以及短依赖距离循环等也给向量化带来了巨大的挑战，并且针对多重循环还缺乏有效的向量化方法；此外，针对特定SIMD扩展的特点也要对向量化算法和代码生成方法做相应的改进。本文主要以国产CPU SW1600为平台，针对SIMD平台的不同特性，提出了改进的SLP算法RLRSLP和ISGSLP；为了克服SLP只对循环内基本块中语句进行向量化的缺陷，增加了对循环整体的分析，在SLP算法中增加了一些辅助优化；根据影响多重循环向量化的主要因素，提出了一种激进的向量化方案；针对SW1600提供的向量重组指令，提出了面向SW1600的向量重组算法。本文的主要贡献和创新有以下四点：第一：由于进行了冗余load语句的删除，SLP算法在处理某些循环时的向量化效率反而不如传统向量化。为此基于SLP算法提出了保留冗余load语句的改进算法RLRSLP，为了解决保留冗余load语句带来的pack生成选择过多的问题，提出了依赖关系指导下UD扩展优先的pack生成方法，确保pack生成严格按照依赖关系进行，省去了SLP算法的调度阶段。此外，大部分的SIMD扩展都提供了较为完善高效的向量重组指令，为此，提出了ISGSLP算法，即在SLP的向量化发掘中加入一个同构语句的pack生成阶段，使其可以向量化那些存在着不连续内存访问的循环。第二：实际应用程序中非连续或者非对齐访存会阻碍程序的向量化或者造成性能损失，此外，单纯依靠SLP算法无法完美地向量化某些特殊循环，诸如规约和短依赖距离循环等，为此，本文针对SLP算法增加了一些辅助优化。针对实际应用中出现的数组引用不连续的情况，提出了一种数学模型刻画数组的访存模式和数据重组方案，以判断这些数组引用是否可以通过数组转置的方法满足连续性要求；并采用过程间数组填充，循环剥离等方法进行对齐优化。针对规约和短依赖循环等特殊情况，在SLP之前进行冗余store删除和规约变换，在SLP之后进行向量操作合并和冗余赋值语句删除等，使得能够更好地对此类循环进行向量化。第三：现有的编译器一般都只针对最内层循环进行向量化，对于多重循环缺少一种通用易行的向量化方法。为此本文提出了一种面向SLP的多重循环向量化方法，从外至内依次对各个循环层次进行分析，收集各层循环对应的一些影响向量化效果的属性值，主要包括能否对该循环进行直接循环展开和压紧，有多少数组引用相对于该循环索引连续，以及该循环所包含的区域等，然后根据这些属性值决定在哪些循环层次进行直接循环展开和压紧，最后通过ISGSLP对循环中的语句进行向量化。第四：由于向量重组指令比较复杂并且不同指令有不同的延迟，从而难以寻找一种统一高效的向量重组算法。本文针对国产CPU SW-1600提供的移位和插入提取指令进行了分析，设计了两种算法使其能以最少的移位或插入提取次数实现向量重组，并提出了一种综合这两类指令实现向量重组的高效算法。

其他文献

电磁搅拌对共晶铝硅合金微观组织的影响

分析了旋转磁场的电磁搅拌作用对共晶铝硅合金微观组织组成、形态及分布的影响,探讨了磁场强度对共晶铝硅合金结晶过程的作用机理及作用规律.

期刊

旋转磁场共晶铝硅合金微观组织rotating magnetic field eutectic AI-Si alloy microscopic struct

基于光电成像的特殊管道静态参数高精度测量技术

高精度的特殊管道在兵器、航天、核能等诸多领域内有着广泛应用。其静态参数的检测是特殊管道设计、研究和使用中一个必需且重要的技术环节。随着特殊管道研制、生产水平和使

学位

场景照明噪声抑制图像分割畸变校正亚像素定位误差补偿

让阅读教学成为语文教学的主旋律

培养和提高学生的阅读能力是一个很重要的教学环节，阅读是语文教学的主体，是培养学生的说话、识字能力和学习语文的主要途径和凭借。提高学生的阅读能力，拓宽学生的视野，丰富学生

期刊

小学语文阅读习惯阅读方法

未知定常海流下UUV对动目标轨迹跟踪控制研究

回回产卜爹仇贱回——回日E回。”。回祖一回“。回干肉果幻中 N_。NH lP7-ewwe--一”＄ MN。W;- __._——————》砧叫]们羽制作:陈恬’＃陈川个美食 Back to yield

学位

水下无人航行器(UUV)轨迹跟踪滑模控制反步控制

初探档案的文化意义及其文化创新功能

本文通过梳理档案与社会及文化发展的关系，总结历史发展的规律。希望档案紧跟时代发展的步伐，积极适应社会主义文化体系建设的新要求，发挥档案的文化创新功能，为繁荣社会主义文化

期刊

档案文化意义创新功能

果糖二磷酸钠口服治疗小儿病毒性心肌炎40例

收集我科2001年3月-2004年12月住院的小儿病毒性心肌炎80例，分别给予果糖二磷酸钠（FDP）口服及1，6-二磷酸果糖（1，6-FDP）静脉滴注治疗，现将结果总结如下。

期刊

儿童病毒性心肌炎果糖二磷酸钠

设计的喧嚣与尖叫

期刊

下一代

国内报纸对安重根刺杀伊藤博文事件的报道(1909—1910)

1909年10月26日,韩国独立军参谋中将安重根在俄国东清铁路哈尔滨火车站击毙了日本枢密院议长、朝鲜统监府首任统监伊藤博文。此事件不仅震动了中日韩俄等当事国,而且还引起英

期刊

1909—1910中文报纸安重根伊藤博文

面向SIMD的向量化算法及重组技术研究

其他学术论文