基于MIC集群平台的GMRES算法并行加速

来源 :计算机科学 | 被引量 : 0次 | 上传用户:fntshb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
广义极小残量法(GMRES)是最常用的求解非对称大规模稀疏线性方程组的方法之一,其收敛速度快且稳定性良好。Intel Xeon Phi众核协处理器(MIC)具有计算能力强、易编程、易移植等特点。采用MPI+OpenMP+offload混合编程模型将GMRES算法移植到MIC集群平台上。采用进程间集合通信异步隐藏、数据传输优化、向量化以及线程亲和性优化等多种手段,大幅提升了GMRES算法的求解效率。最后将并行算法应用到"局部径向基函数求解高维偏微分方程"问题的求解中。测试表明,CPU节点集群上开启32个进程
其他文献
陀螺仪传感器是飞行控制系统的重要组成部分;针对4种类型陀螺仪介绍了一种自动测试系统的设计,详细描述了系统的功能和总体结构,提出了自动测试的过程控制策略,给出了系统硬件设
论文设计了一种基于现场总线的网络化超薄高速连续轧制工程控制系统;系统采用Profibus总线,实现了连续轧制的可靠性及系统的综合性管理,提高了生产效率;以某1450mm铝箔轧机控制系
电磁环境效应验证是通过对预期电磁环境场景的"再现",以及电磁作用过程的分析与模拟,性能变化的检查与测量,以达到对目标环境适应能力的综合评价;数据库存取与管理是电磁环境效应验证测量系统的重要组成部分,文中介绍了C/S(客户机/服务器)模式下,基于ODBC(开放数据库连接)的VC++6.0访问Oracle数据库技术,实现了客户机和服务器之间的通信,数据源的自动注册,并用SQL(结构化查询语言)语句对服
在分析微石英音叉陀螺的工作原理及电学特性的基础上,对微石英音叉陀螺的驱动电路和微弱角速度信号的提取方法进行了研究;论证了方波驱动的可行性,提出了在自激驱动回路中加
针对传统的信息与时间电控系统ETACS(Electrical Timer And Control System)产品测试中存在的缺陷,利用虚拟仪器技术,对信息与时间电控系统产品测试进行了实验与研究.提出了一种ET
多条序列的最长公共子序列可以代表多条序列的公共信息,其在诸多领域里有着重要的应用,如信息检索、基因序列匹配等。求解多条序列的最长公共子序列是著名的NP难问题,本质为
当今社会,人们越来越多地通过社交网络来发言、聊天、交友。在互动过程中,除了用户主动关注感兴趣的人之外,社交网络也会为其推荐朋友。然而,所推荐的朋友大部分只是社交网络