虚拟化与云计算云架构研讨.pptVIP

  • 0
  • 0
  • 约5.66千字
  • 约 61页
  • 2017-05-07 发布于湖北
  • 举报
虚拟化与云计算云架构研讨

* * * * * * * * * * * * * * * * * MapReduce: 更多的例子 MapReduce : PageRank PageRank 是描述“random surfer”行为的模型 C(t) 是t的链接数, (1-d) 是阻尼系数(随机跳转) “random surfer”指的的是随机的链接情况并不考虑具体的网页内容 将pages rank平均分配给所有的链接网页 阻尼系数用于描述“无聊”和随意的URL PageRank : 关键理解 每次迭代的影响是有限的,第i+1次迭代仅仅依赖于第i次迭代 第i次迭代,每个节点的PageRank可以独立地计算 PageRank 使用 MapReduce M表示为系数矩阵 M的每行是分配给链接网页的PageRank值 这些值通过reduce聚集得到网页的PageRank值 PageRank 使用 MapReduce Map: 将PageRank 值分配给链接目标 Reduce: 从多个源聚集PageRank值计算得到新的PageRank值 不断迭代 直至收敛 Source of Image: Lin 2008 阶段 1: HTML处理 Map任务输入(URL, content) 对进行map后输出(URL, (PRi

文档评论(0)

1亿VIP精品文档

相关文档