大数据技术基础培训-GraphLab技术培训.pptx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
大数据技术基础培训GraphLab 技术培训Social MediaWebAdvertisingScience图用来编码/描述知识和联系::Big: billions of vertices and edges and rich metadata人产品想法事实兴趣图是机器学习和数据挖掘的重要基础之一发现有影响力的人或者信息发现社区或者社交圈或者团伙精准广告/产品定位 复杂数据/知识依赖性建模图并行算法的特性DependencyGraphFactored Computation IterativeComputationWhat I LikeWhat My Friends Like为什么MapReduce不合适Map-Reduce不能高效表示依赖图User must code substantial data transformations Costly data replicationIndependent Data Rows为什么MapReduce不合适(2)IterationsDataDataDataDataCPU 1CPU 1CPU 1DataDataDataDataDataDataDataDataCPU 2CPU 2CPU 2DataDataDataDataDataDataDataDataCPU 3CPU 3CPU 3DataDataDataSlowProcessorDataDataDataDataDataBarrierBarrierBarrierMap-Reduce 无法高效描述迭代算法:为什么MapReduce不合适(3)图算法通常只有一部分数据(子图)需要计算:IterationsDataDataDataDataCPU 1CPU 1CPU 1DataDataDataDataDataDataDataDataCPU 2CPU 2CPU 2DataDataDataDataDataDataDataDataCPU 3CPU 3CPU 3DataDataDataDataDataDataDataDataBarrierBarrierBarrier为什么MapReduce不合适(4)Hadoop Map/Reduce没有为迭代算法优化IterationsDataDataDataDataCPU 1CPU 1CPU 1DataDataDataDataDataDataDataDataCPU 2CPU 2CPU 2DataDataDataDisk PenaltyStartupPenaltyStartup PenaltyDisk PenaltyStartup PenaltyDisk PenaltyDataDataDataDataDataCPU 3CPU 3CPU 3DataDataDataDataDataDataDataData图并行算法抽象A user-defined Vertex-Program runs on each vertexGraph constrains interaction along edgesUsing messages (e.g. Pregel [PODC’09, SIGMOD’10])Through shared state (e.g., GraphLab [UAI’10, VLDB’12])Parallelism: run multiple vertex programs simultaneouslyDepends on the popularity their followers示例Depends on popularityof her followersWhat’s the popularityof this user?Popular?PageRank AlgorithmRank of user iWeighted sum of neighbors’ ranksUpdate ranks in parallel Iterate until convergencePregel (Giraph)ComputeCommunicateBarrierBulk Synchronous Parallel Model:The Pregel AbstractionVertex-Programs interact by sending messages.Pregel_PageRank(i, messages) : // Receive all the messages total = 0 foreach( msg in messages) : total = total + msg // Update the rank of this vertex R[i] = 0.15 + total // Send new messa

文档评论(0)

智慧IT + 关注
实名认证
内容提供者

微软售前技术专家持证人

生命在于奋斗,技术在于分享!

领域认证该用户于2023年09月10日上传了微软售前技术专家

1亿VIP精品文档

相关文档