【摘 要】
:
基于单机的图处理系统具有较高的性能价格比和潜在的可扩展性,因此具有广阔的应用前景。然而,大规模图处理面临着数据局部性差、访存计算比高、数据高度不规则等问题。由于图数据规模的不断增长,这些问题在单机上基于外存的场景下显得尤为突出。一方面,一些基础的图算法在大规模图数据集上较难做到高效率地实现;另一方面,提供通用接口的图处理系统往往存在I/O效率不高、收敛速度较慢等问题。因此,本文从典型的图遍历算法B
论文部分内容阅读
基于单机的图处理系统具有较高的性能价格比和潜在的可扩展性,因此具有广阔的应用前景。然而,大规模图处理面临着数据局部性差、访存计算比高、数据高度不规则等问题。由于图数据规模的不断增长,这些问题在单机上基于外存的场景下显得尤为突出。一方面,一些基础的图算法在大规模图数据集上较难做到高效率地实现;另一方面,提供通用接口的图处理系统往往存在I/O效率不高、收敛速度较慢等问题。因此,本文从典型的图遍历算法BFS入手,结合现实世界图数据的特点和存储设备的特性,对该算法进行了优化;进一步地,对通用图系统中数据I/O、图数据划分和一致性策略等方面进行了研究。本文的创新点主要有:·单机上社交图数据的快速广度优先搜索方法FastBFS。通过分析大规模社交图数据的特点,充分利用BFS算法在数据访问过程中的特性,加速单机上的广度优先搜索过程。采用以边为中心的图处理策略来提高外存访问的带宽,同时降低图划分和重新组织的开销。提出基于异步I/O的删边机制,删除与后续计算无关的边来有效地减小遍历过程中的数据量。此外,通过高效地调度I/O数据流,Fast BFS可以使用多块磁盘来提高I/O并行度,从而加速计算。实验结果表明,Fast BFS在计算性能上最高可以达到单机外存图处理系统X-Stream和Graph Chi的2.1和3.9倍。·单机上Web图数据的快速广度优先搜索方法Fast BFS+。针对Web图等直径较长的图数据的特性,提出高效灵活的图遍历方法Fast BFS+。引入跨迭代的异步删边机制,提高处理效率。提出动态的删边机制,通过设置阈值的方法动态开关删边机制,从而大幅度降低在Web图数据上由删边所引入的开销。实验结果表明,Fast BFS+能够在Web图数据上获得良好的性能,执行速度与X-Stream和Graph Chi相比达到数倍的提升。·单机上基于非对称二维分区的异步图处理方法Async Stripe。提出二维非对称的图划分方法,兼顾数据访问的局部性和计算调度时的高效性。利用基于条带的数据访问策略,获得较高的磁盘访问带宽和更小的I/O访问数据量。同时,Async Stripe还支持两种异步一致性策略,异步地执行不同类型的图算法,大幅度加快收敛速度。实验结果表明,对于典型的遍历算法和稀疏矩阵乘法算法,Async Stripe的性能优于X-Stream和Grid Graph等典型系统。
其他文献
能传导锂离子的无机陶瓷电解质和有机聚合物电解质是固体或类固体材料,都能作为正负极之间无孔致密电解质隔层单独或与电解液组合用于锂电池中,尤其是用于被认为是下一代电池的锂金属电池中,可以减少金属锂负极的副反应,并较好地防止锂枝晶穿透,有助于解决锂金属电池的循环稳定性和安全性问题。两者在应用场合上具有互补性,都是被热点研究的新型电解质隔层材料。本论文分为两部分,分别研究这两种电解质。第一部分研究石榴石型
阶梯-深潭系统是山区河流在水力作用下自我调节形成的地貌单元,具有稳定河床和生态友好的特点,可高效用于山区河流下切控制及生态修复工程。不过阶梯-深潭系统会在重现期30-50年的洪水中失稳破坏。现有研究尚未揭示阶梯-深潭系统失稳机理,无法为量化建模及工程应用提供科学支持。本文通过水槽试验,观测清水冲刷过程中阶梯-深潭系统的地形流场变化和失稳破坏细节。通过持续增加流量(CIFR)试验探究阶梯-深潭系统对
合金凝固过程中经常施加超声、电磁等外场,通过产生受迫运动等作用改善凝固组织。同时合金凝固过程中有时自然对流也对凝固组织有明显影响。因此,研究流动对凝固组织的影响具有深远的学术意义和重要的工程应用价值。本文以合金凝固过程的外场处理为背景,通过建模仿真研究了强迫流动和自然对流对合金凝固组织的影响。建立了模拟流场下枝晶生长的基于格子玻尔兹曼方法(LBM)和相场方法(PF)的流场相场耦合计算模型。开发了基
有机半导体材料电荷传输的研究受到广泛关注。近期实验上在有机给受体复合物材料,尤其是在光伏材料领域取得了重大突破。然而,对这类材料的理论研究相对滞后,电荷传输机制尚不明确。在给受体复合物材料中,相邻的两个给(受)体中间,夹杂着受(给),称之为“桥”。相邻给(受)体没有直接耦合,而是通过“桥”的分子轨道的辅助,形成超交换耦合。本论文基于第一性原理计算,通过矩阵分块约化的方法来计算超交换耦合,对有机半导
随着高密度读出电子学技术和时间投影室探测器技术的发展,利用单一径迹探测器测量复杂电离径迹(例如低能电子的散射径迹)成为可能。采用径迹探测器获得电离径迹的形态特征和能量特征,发展相应的径迹特征提取方法,是当前粒子探测实验的研究热点之一。然而,由于电离径迹可能发生的大角度偏转和回绕,提取径迹特征是一个难点。本论文针对电离径迹的特征提取开展通用方法研究,结合图论的方法,提出一种反映径迹形态特征和能量特征
基于等离子体尾波的先进加速技术在过去十年取得了巨大进展,有望为激光和加速器的应用带来革命性变化。当前尾波加速研究的关键挑战之一是如何可控地产生远优于现有加速器技术的高品质束流。本论文针对这一问题开展深入研究,在系统梳理注入过程一般性规律的基础上,重点研究了电离注入与等离子体密度调变注入两类方法,提出了能够有效产生超高品质束流的新方案。此类方案能将束流亮度在现有技术基础上提升3-6个量级,一旦在实验
BEGe探测器是一种内部电极极小、具有单载流子响应特性的高纯锗探测器,故它在波形甄别方面更具有优势。BEGe探测器主要用于需要较低本底水平的γ谱分析和无中微子双贝塔衰变探测。对于一套基于良好屏蔽措施及材料筛选的低本底BEGe装置,波形甄别是进一步抑制本底水平的有效手段。在BEGe探测器的主要应用场景中,信号和本底事例多为光子事例。本论文主要对光子事例在低本底BEGe中的物理作用机制和波形表现进行了
细胞内各种生化反应及新陈代谢过程均是在限域环境中进行的。细胞内限域环境包含细胞质中的大分子限域、生物膜结构为膜蛋白等提供的限域环境以及由膜围绕形成的各种细胞器组成的微纳尺寸局部限域环境。限域环境对于维持细胞正常生理功能意义重大,它们调节生物分子的组装和修饰、为生化反应及物质运输提供特异性环境以及精确调控着细胞内物质和能量的传输。体外构建模拟细胞内限域环境的策略主要分为两类,即宏观尺度构建及微纳尺度
空间辐射环境对宇航电子系统构成严峻的可靠性威胁。纳米集成电路具有高性能、高集成度等优点,是未来宇航电子系统的必然选择。辐射效应严重影响纳米集成电路的可靠性,尤其是单粒子效应,限制它广泛用于宇航电子系统。随着集成电路工艺节点的缩小,集成电路晶体管密度提高、工作电压降低、工作频率增加等变化和空间多种辐射效应并存、温度变化范围广等特点导致纳米逻辑电路的单粒子效应研究愈发具有挑战性。本文深入研究纳米体硅C
纳米尺度MOSFET器件的按比例缩小面临着诸多挑战,采用高迁移率材料作为沟道的MOSFET器件或者采用基于隧穿原理工作的TFET器件将有可能是未来推动“摩尔定律”继续发展的技术方案。近年来新型GeSn合金材料由于其独特的能带结构而备受关注。GeSn合金具有高迁移率的特性,同时其可能的直接带隙特性也有利于载流子隧穿能力的提升,可见GeSn有望应用于未来高性能的MOSFET和TFET等场效应器件中,因