基于Intel Xeon Phi的稀疏矩阵向量乘性能优化

来源 :小型微型计算机系统 | 被引量 : 0次 | 上传用户:shb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
稀疏矩阵向量乘(Sp MV)是线性求解系统等科学计算中重要的计算核心.鉴于传统的稀疏矩阵向量乘算法在Intel Xeon Phi众核集成架构上存在SIM D利用率低,不规则访存开销高及负载不均衡的问题,难以发挥其运算能力.本文针对Intel Xeon Phi的体系结构特点,提出了一种通用的分块压缩存储表示的稀疏矩阵向量乘并行算法:(1)在ELLPACK存储格式基础上按列分块及压缩矩阵,增加非零元的密度,提高SIMD利用率;(2)通过精心的数据重排,保留矩阵非零元本身的局部性,从而提高数据重用率,降低访存开
其他文献
夏至过后,开始进入真正意义上的夏季高温季节,鱼、虾、蟹等各类养殖也进入养殖关键时期.这一阶段,养殖池塘水温快速升高,养殖品种生长速度加快,存塘量也随着个体生长而不断增
近年来我国建筑行业取得了较快的发展,建筑工程施工项目和施工规模不断扩大,人们对建筑工程结构也提出更高的要求,为了增强建筑结构的多功能性,在当前建筑工程施工过程中,结
稀疏表示无需降维即可在原始的高维度空间对数据进行分类.当把数据投影到字典原子组成的过完备字典时,只需要很少的字典原子就可以表示这个数据.本文利用稀疏表示算法对高光
大连市自1998年开展狐人工授精技术以来,收到较好的经济效益和社会效益.rn对狐人工授精技术普遍接受和认可.rn
本文对发动机燃用LPG(液化石油气)-柴油双燃料时,进行了LPG不同配比及负荷等因素对发动机有害排放物影响的研究.试验结果表明,随着LPG比例的增大,发动机的烟度及NO减少,而HC
在高层建筑中,剪力墙较为常见,其承担着高层建筑的水平负载力,以此来保证建筑整体的稳定性.将短肢剪力墙结构在高层建筑结构中进行应用,可以有效的保证建筑结构的刚度和稳定
在目前我国社会经济快速发展的背景下,各行各业都迎来了新的发展机遇,得到了较快的发展,尤其建筑行业更是得到了前所未有的发展,与此同时,建筑质量也逐渐成为人们当前所关注
随着中国城市化进程的加快,中国的城市建设正在全面展开.有必要将城市设计纳入城市规划,以便在保护自然环境和促进可持续社会发展战略的实施方面发挥积极作用,希望本文的相关
本文从市场营销学的角度 ,分析研究我省消防产品行业的现状 ,提出了较长一段时间内我省消防产品行业的发展方向 ,以及如何运用市场营销学的知识来指导帮助企业发展。 This a
近年来,笔者发现许多池塘养草鱼业主缺乏科学饲料投饲技术,存在很多投饲误区,即便饲喂优质饲料,也很难获得预期的养殖效益,使养殖成本无形中大幅攀升.为提高饲料的利用率,最