基于PPR模型的稀疏矩阵向量乘及卷积性能优化研究

来源 :计算机研究与发展 | 被引量 : 0次 | 上传用户:gexuefeng1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
稀疏矩阵向量乘和卷积作为高性能计算的两大计算核心,是非规则和规则访存的典型代表.目前已经做了许多针对性的优化工作,但是对于大量运行着不同指令集和拥有不同计算和访存性能的机器,仍然无法判定在特定的体系结构下导致性能效率无法被完全释放的主要原因及性能瓶颈,同时也很难准确预测出程序在特定机器上可达到的最佳性能.通过使用性能模型方法,建模程序在真实机器上的运行细节,可以得出更加精确的性能预测,并且根据模型输出的反馈信息提出针对性的优化指导.提出了PPR(probability-process-ram)模型,并在一
其他文献
以学生为中心是以人文本的教学理念的最新要求,也是调动学生主动参与课堂的重要前提。新课程要求尊重和发挥学生的主动性。学生主体性的发挥落实到教学中,一般最直接的体现就
近年来,我国加大了对于教育改革事业的关注程度与实施力度,对教育体制以及教育理念进行了有效的创新调整。在这一任务推进的过程中,各种不同的创新性教学手段也层出不穷,成为
早晨七八点钟的太阳被薄雾簇拥着,微微地泛着温柔的光 泽,像极了褪了色的蛋黄。父亲的车从所住的郊外驶进小镇, 渐渐地,车窗外从郁郁葱葱的树木变成了人行道上匆匆忙忙的 上
山东省夏津县宋楼镇时庙村是大棚番茄种植专业村,去年以来,该村的100户菜农在笔者帮助和指导下,采取了“春提前茬”和“秋延迟茬”一年两种两收栽培新模式,种植大棚番茄20 hm
图计算已成为大数据处理领域的主流应用,采用特定硬件加速可以显著提高图计算的性能和能效.众所周知,硬件代码的编写和验证十分耗时,尽管通用高层次综合(high level synthesi
传统的文言文教学方式已经不能适应新课标所提倡的核心素养四个方面全面发展的理念。本文试图从语文学科素养的角度分析文言文中“文”和“言”之间的关系,以及文言文教学的
目的探讨基于氟18-脱氧葡萄糖(^(18)F-FDG)正电子发射计算机断层显像-计算机断层扫描(PET-CT)的国际一致化项目(IHP)法、Deauville 5分法和最大标准摄取值下降率(△SUVmax)法
小学阶段学校空间内的传统文化教育对学生个人成长、传承中华优秀传统文化有着举足轻重的作用。鉴于部分小学在传统文化教育教学上存在一些问题,如课程资源开发有限、学校教
作为目前主流的大数据流式计算平台之一,Storm在设计之初以性能为目的进行研究而忽视了高能耗的问题,但是其高能耗问题已经开始制约着平台的发展.针对这一问题,分别建立了任
目的探讨CAD基因在泛癌中的预后评估作用。方法从症基因组图谱数据库下载了33种肿瘤的转录组测序数据,同时下载了相应患者的临床信息、肿瘤突变负担和微卫星不稳定性的信息,