X-StreamEdge-centricGraphProcessingusingStreamingPartitions..doc

X-StreamEdge-centricGraphProcessingusingStreamingPartitions..doc

  1. 1、本文档共24页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
X-StreamEdge-centricGraphProcessingusingStreamingPartitions.

X-Stream: Edge-centric Graph Processing using Streaming Partitions 摘要 X-Stream是在共享存储机器上既能处理存放于外存,又能处理存放于内存的图数据处理系统。虽然依然采用在顶点集中存储图状态的发散和收集编程模型,X-Stream的新颖之处在于(i)采用edge-centric而不是vertex-centric来实现这个模型,(ii)对完全无序的边列表实行流式传输而不是随机访问。对所有的存储介质(主存,固态硬盘,磁盘 )来说,顺序访问带宽实际上要比随机访问带宽大是促动这一设计的主要原因。 我们已经证实了大量的图算法可以用这种edge-centric的发散与收集模型表示。 这个实现结果在具有不同数量的计算核心,不同数量的I/O设备,不同的存储介质的计算机上得到了很好的扩展。X-Stream在和现有的图数据处理系统的竞争中表现突出。除了采用顺序访问外,我们认为X-Stream在预处理过程中不需要存储边列表也是其表现突出的主要原因。 1 引言 对大规模图数据的分析是一个开始在研究领域吸引更多注意的应用程序。人们对其兴趣高涨一部分是因为在现实世界中不同种类的大量信息是用图来编码的。图数据处理面临一个有趣的系统挑战:在遍历边时缺少其位置信息使获得好的性能变得困难。 这篇论文描述了X-Stream,用于在共享存储机器上处理大规模图数据的系统。类似于Pregel和Powergraph,X-Stream在顶点集中维护图的状态并由此揭示了一个发散与收集编程模型。对图的计算被组织成一个循环,每次迭代由一个发散阶段后跟一个收集阶段组成,实例1说明了这个发散与收集模型的一般实现。发散和收集阶段均对所有的顶点进行迭代。用户提供一个发散函数用于向邻点传播状态和一个收集函数用于累计邻点的更新来重新计算顶点的状态。这个简单的模型对于包括从计算最短路径到在一个搜索引擎中对网页进行排序在内的大量图算法来说都是有效的,因此,这是一个图处理系统的流行接口。 一个可行(直接)的用于处理存放于内存或外存中大规模图数据的方法是根据源点对图中的边进行排序并在存储的边列表上建立索引。那么在执行过程中包括对索引的随机访问来确定一条边所关联的顶点。在这种设计中隐含了对于随机访问和顺序访问的折衷,尽量减少用于确定边所关联顶点的对索引的随机访问,流式传输大量无关边并选择那些和活跃顶点相关联的边,这就是要在这篇文章中重新描述的折衷。 对于任何存储介质来说,随机访问带宽比顺序访问带宽要小。例如,在我们的测试平台上(16 core/64 GB 1U server, 7200 RPM 3TB magnetic disk and 200 GB PCIe SSD),对磁盘来说,顺序读比随机读快500倍,对固态磁盘来说,这个数字是30,甚至于对主存来说,由于存在硬件预取,在单核计算机上,顺序访问比随机访问快4.6倍,对于16核计算机来说,这个数字是1.8。更多细节参见5.1节。 在这篇文章中我们证实了可以仅仅根据从存储器流动数据的原则,利用顺序访问比随机访问带宽大来建立一个图数据处理系统。我们展现了这种设计可以引导出一个既适用于处理内存中图数据又适用于处理外存中图数据的有效图数据处理系统,在大多数情况下,相同或更好性能的系统都建立在对索引进行随机访问的基础上。 为了达到这个层次的性能,X-Stream引入了一个edge-centric方法来处理发散与收集,如实例2所示:发散和收集阶段对所有的边进行迭代,并对边集进行更新而不是对顶点集。 edge-centric方法同样避免对边集的随机访问,取而代之的是从存储器中流式传输。对图来说,边集远远大于顶点集,顺序访问边并更新它们控制了处理的开销,因此,对边进行流式传输通常比随机访问它们更具优势,这样做的结果是,要付出随机访问顶点集的代价。我们使用流分区来减少这种代价:我们对顶点集进行分割以使得每片分区可以适用于高速存储器(对基于内存的图指的是cache,对基于外存的图指的是主存)。更进一步,我们对边集进行分区并使得边和它们的源点在同一片分区中。然后,我们每次对一片分区进行处理,首先读取它们的顶点集并从存储器中流式传输它们的边集,这种方法的有利之处在于我们不需要存储边列表,因此,不会像其它系统一样在预处理时导致延迟。 Graphchi是首个实行避免对边集进行随机访问的系统。Graphchi使用了一个新颖的包含名为“shards”的由图的分区组成的核外数据结构。不同于流分区,shards必须根据源顶点进行预排序,导致了不可忽视的预处理开销,特别是当图使用地不频繁时。Graphchi仍然使用示例1所示的vertex-centric实现,这就要求sh

文档评论(0)

xznh + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档