- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
大数据技术基础培训GraphLab 技术培训Social MediaWebAdvertisingScience图用来编码/描述知识和联系::Big: billions of vertices and edges and rich metadata人产品想法事实兴趣图是机器学习和数据挖掘的重要基础之一发现有影响力的人或者信息发现社区或者社交圈或者团伙精准广告/产品定位 复杂数据/知识依赖性建模图并行算法的特性DependencyGraphFactored Computation IterativeComputationWhat I LikeWhat My Friends Like为什么MapReduce不合适Map-Reduce不能高效表示依赖图User must code substantial data transformations Costly data replicationIndependent Data Rows为什么MapReduce不合适(2)IterationsDataDataDataDataCPU 1CPU 1CPU 1DataDataDataDataDataDataDataDataCPU 2CPU 2CPU 2DataDataDataDataDataDataDataDataCPU 3CPU 3CPU 3DataDataDataSlowProcessorDataDataDataDataDataBarrierBarrierBarrierMap-Reduce 无法高效描述迭代算法:为什么MapReduce不合适(3)图算法通常只有一部分数据(子图)需要计算:IterationsDataDataDataDataCPU 1CPU 1CPU 1DataDataDataDataDataDataDataDataCPU 2CPU 2CPU 2DataDataDataDataDataDataDataDataCPU 3CPU 3CPU 3DataDataDataDataDataDataDataDataBarrierBarrierBarrier为什么MapReduce不合适(4)Hadoop Map/Reduce没有为迭代算法优化IterationsDataDataDataDataCPU 1CPU 1CPU 1DataDataDataDataDataDataDataDataCPU 2CPU 2CPU 2DataDataDataDisk PenaltyStartupPenaltyStartup PenaltyDisk PenaltyStartup PenaltyDisk PenaltyDataDataDataDataDataCPU 3CPU 3CPU 3DataDataDataDataDataDataDataData图并行算法抽象A user-defined Vertex-Program runs on each vertexGraph constrains interaction along edgesUsing messages (e.g. Pregel [PODC’09, SIGMOD’10])Through shared state (e.g., GraphLab [UAI’10, VLDB’12])Parallelism: run multiple vertex programs simultaneouslyDepends on the popularity their followers示例Depends on popularityof her followersWhat’s the popularityof this user?Popular?PageRank AlgorithmRank of user iWeighted sum of neighbors’ ranksUpdate ranks in parallel Iterate until convergencePregel (Giraph)ComputeCommunicateBarrierBulk Synchronous Parallel Model:The Pregel AbstractionVertex-Programs interact by sending messages.Pregel_PageRank(i, messages) : // Receive all the messages total = 0 foreach( msg in messages) : total = total + msg // Update the rank of this vertex R[i] = 0.15 + total // Send new messa
您可能关注的文档
最近下载
- 国开(BJ)-公共危机管理(本)-第五次形成性考核-学习资料.docx VIP
- 有机茶园的生产与管理有机茶园施肥技术有机茶园的生产与管理有机茶园施肥技术.ppt VIP
- 认知心理学-注意过程.ppt VIP
- 2025年生物医药创新药研发资金投入与效益分析报告.docx
- hpmont海浦蒙特 MT70-CTS-B使用说明手册.pdf VIP
- 有机茶园的生产与管理有机茶园病虫害控制技术有机茶园的生产与管理有机茶园病虫害控制技术.ppt VIP
- 《中西方神话对比》课件.ppt VIP
- 初中体育教师职称评审总结范文.docx VIP
- 体育教师职称总结.pdf VIP
- 建筑工程图集 05J909:工程做法.pdf VIP
文档评论(0)