【摘 要】
:
现有的外存图计算系统中,设计重点集中在以通用的方式对各类应用进行处理,在执行时通过对图数据的完整遍历完成计算的迭代过程。但实际上图应用中往往不需要对图数据进行完整
论文部分内容阅读
现有的外存图计算系统中,设计重点集中在以通用的方式对各类应用进行处理,在执行时通过对图数据的完整遍历完成计算的迭代过程。但实际上图应用中往往不需要对图数据进行完整的访问,而是根据自身的需求对部分“活跃顶点”进行访问,利用这一特性,在对外存进行访问时避免访问无关的数据而只访问“活跃顶点”相关的数据,可以大幅度的缩小实际计算过程中进行I/O的数据量,进而大幅提升性能。为了实现在运行时在外存中对所需要的数据进行定位读取,提出了一种应用在外存图处理系统中基于活跃顶点进行I/O访问的方法,通过以顶点为单位对图数据进行重新组织使得同一顶点相关的边都存放在一起便于读取,然后以顶点为单位建立索引,使得在对指定顶点相关数据进行取时可以快速进行定位。基于这种方案,进一步改进了计算模型,使系统能更好的在不需要构建全部子图的情况下高效运行。这种方法减少了需要进行I/O的数据量,但是带来的一个新问题是由原本的顺序访问变成了随机访问。由于顺序访问的性能远高于随机访问。因此如何权衡大数据量的顺序访问与小数据量的随机访问的I/O性能是能否取得性能提升的关键。基于上述问题,本文进而提出了一种基于收益评价的I/O访问选择策略。通过预先分析和计算不同策略进行I/O访问的开销,选择开销较小的方式执行应用更新。通过将这两种方法结合,可以使得应用始终以最优的方式执行迭代更新过程,获得效率和性能上的提升。在针对不同类型应用和数据的测试中展现出不同幅度的性能优化,在迭代计算类的应用中加速比可以达到1.2至1.6,而路径算法的应用中加速比可以达到20以上。最后根据应用的特性,对产生优化的原因以及幅度的差异作出归纳和分析。
其他文献
随着5G技术的发展,许多如VR,AR,车联网等对带宽需求高,延迟小的应用纷纷被提出,同时应用终端的普及带来的巨大流量都对传统的LTE/EPC网络结构提出了新的挑战。进一步也给传统
近年来,国内商业银行的国际业务竞争日益激烈。不同于商业银行的资产、负债类业务,国际业务具有经济资本占用低、自偿能力强、综合收益高等特点,有助于改善商业银行的资产负
无线局域网(WLAN)具有数据传输速率快、可移动办公、安装便捷等优点。目前,WLAN已经在人流量大的公共场合以及集中办公点、学校等区域得到了广泛应用。天线作为接入设备的核
近几年,随着地震资料处理、解释技术的快速发展,处理、解释高性能运算的数据量呈海量增长趋势,对大型PC集群处理计算机和解释工作站的运算能力以及存储能力提出了更高的要求,
输电线路掏挖基础是通过机械或人力的方法将土体开挖成基坑,后将钢筋骨架和混凝土在基坑内完成浇筑的基础形式。因其具有土体开方量小、施工方便、减小水土流失、环保等突出
Turbo码和低密度奇偶校验码(LDPC码)都是性能逼近香农限的实用好码。而作为Turbo码和LDPC码共同的子集,不规则重复累积码(IRA码)码既具有Turbo码的低编码复杂度特性,又具有LD
背景与目的食管鳞状细胞癌(esophageal squamous cell carcinoma,ESCC)在中国每年新诊断病例约有25万而且世界上食管癌病死率最高的国家也为中国。我国食管癌总发病率为22.14
机会传感网络是一种不需要源节点和目标节点之间存在完整路径,利用节点移动带来的相遇机会实现通信的自组织网络。若机会传感网络中某个节点失效,造成整网连通性被严重破坏或
银行的业务中,针对小额贷款的项目相对较少,且借款手续复杂,针对这个问题,P2P网络借贷随之而起。P2P网络借贷主要由以下两大优势,一是借款迅速,二是利率高。本文主要针对P2P
从新兴的互联网行业,到传统的航空航天工业,具有高扩展性与高可靠性的分布式存储技术正在逐步取代传统的集中式存储技术。然而,受限于客户端网络接口带宽,分布式文件系统数据