大型周期块三对角线性方程组的并行算法

来源 :西北工业大学 | 被引量 : 2次 | 上传用户:kcsj001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
充分发挥并行计算机的潜在性能,寻求大型稀疏线性代数方程组的高效并行解法,是当前大规模科学计算中急待解决的问题,也是研究的热点问题。并行算法设计与并行程序实现的关键,是依据不同并行计算机的结构特征,减少整体通讯并尽量使各处理机之间负载平衡。本文基于分布式存储环境,着重研究系数矩阵为大型周期块三对角的线性方程组的并行求解问题,提出一些相应的高效分布式并行算法。主要完成了以下工作: 1.基于对系数矩阵的分解,根据分治思想提出了一种近似直接并行解法,使算法只在相邻处理机间有两次通信,有效地减少了通信次数.从理论上,给出了该算法成立的一个充分条件.并在HPrx2600集群上进行了数值计算,验证了该算法的有效性和可行性。 2.在方法1的基础上导出了一种并行求解周期块三对角线性方程组的迭代解法,通过对系数矩阵进行适当的分裂,使算法在不满足方法1的条件下,也能够计算,即扩大了方法的使用范围。从理论上,讨论了误差,给出了系数矩阵为Hermite正定矩阵和M-矩阵时算法的收敛性条件,最后在HPrx2600集群上进行了数值计算验证。 3.为加快方法2的收敛速度,引入松弛因子ω,得到一种松弛迭代并行算法,虽然理论分析收敛性条件尚不完善,有待进一步研究和探讨,但数值算例结果表明,该方法具有很高的并行效率,且迭代次数大大减小,收敛速度大幅度加快. 4.提出了一种求解周期块三对角线性方程组的迭代并行算法,并给出了相关的理论和数值算例。 5.基于Galerkin原理,提出了一种求解块三对角线性方程组的Arnoldi并行算法,通过选取适当的子空间,使算法只在相邻处理机间有通信,因而具有很好的并行性,而且证明了该算法的收敛性.在HPrx2600集群上进行数值计算。结果表明,加速比呈线性增加,并行效率达到90﹪以上。
其他文献
精确的单体型频率可为疾病基因的定位、影响标记间相关性因素的发现以及人类进化、复杂疾病中两个或更多基因间的顺式相互作用提供重要信息和依据。本文将核心家庭中用最大期
本文研究了概念格与α-概念格的属性约简问题.(1)讨论了概念格中的不变量,提出了基于不变量的概念格约简,给出了协调集的判定定理,并研究了属性的重要程度.(2)提出了协调形式背
本文研究的主要内容包括:孤子方程族的生成和Lie群结构方程,Hamilton结构,Liouville可积性,无穷守恒律,Lax对与共轭Lax对的双非线性化及可积辛映射与有限维Hamilton系统,孤子方程的
学位
本论文是在参与国家社会科学基金资助项目“我国商业银行效率与竞争力研究”(04BJY082)的研究过程中完成的。 本文选用了国内GDP、各产业产值、社会消费品零售额等8个与银
由于人工神经网络(ANN)在自动化控制、模式识别、图像处理、信号处理以及最优化计算等领域的广泛应用而曰益受到人们的关注.在应用人工神经网络解决某些实际问题时,常常要求尽
本文对带特殊重试时间的M/M/1重试排队模型的一个特征值及其应用进行了研究。全文分两章.第一章分两节.第一节中回顾排队论的历史,第二节中介绍补充变量方法,由此提出本文要研