论文部分内容阅读
对大规模稀疏线性方程组的求解由于其所涉及的矩阵规模大、访存的不规整等问题而成为当前科学研究和工程应用计算中的瓶颈。并且在通用体系结构的平台下,完成该任务难以提高访存带宽的利用率并且难以均衡各核的计算任务。因此,针对大规模稀疏方程组的求解开展定制的体系结构技术研究成为寻求解决该问题的一条途径。定制体系结构技术从计算机的结构层面出发,结合算法的计算、访存和通信的特点,进行体系结构设计。这么做使得专用计算机的体系结构天然的与算法特点相匹配,达到硬件资源更少、执行速度更快、机器功耗更小的目的。本文围绕大规模稀疏线性方程组的求解,在深入分析了求解这类方程组的主要算法以及面临的问题和解决方案之后,从面向数值计算和密码学领域两个大的方向对稀疏方程组的求解进行了并行加速研究和定制的体系结构设计。本文主要涉及的算法有数值计算中的Cholesky分解算法和密码学领域中的Wiedemann算法。本文提出了面向Choleksy数值型大规模稀疏方程组求解算法的并行定制体系结构,建立了访存约束条件下的性能分析模型。实验验证了并行定制体系结构的有效性和性能分析模型的准确性;提出了面向Wiedemann有限域下大规模稀疏方程组求解算法的并行定制体系结构,建立了访存约束条件下的性能分析模型。实验验证了该并行定制体系结构的高效性。