MapReduce编程简介(PPT-38).pptVIP

  • 7
  • 0
  • 约6.96千字
  • 约 38页
  • 2018-03-02 发布于江西
  • 举报
MapReduce编程简介(PPT-38)

MapReduce实例 文档倒排索引算法 - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - 搜索: fish ? doc1, doc2 red ? doc2, doc3 red fish ? doc2 doc1: one fish two fish doc2: red fish blue fish doc3: one red bird 倒排索引: one: doc1, doc3 fish: doc1, doc2 two: doc1 red: doc2, doc3 blue: doc2 bird: doc3 Map:输入 (文档名+行号, 内容); 输出list(单词, 文档名) Reduce: 输出(单词, list(文档名)); 输出list(单词, 文档列表) MapReduce实例 文档倒排索引算法 - Map端 - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - MapReduce实例 文档倒排索引算法 – Reduce端 - - - - - - - - - - - - - - - - - - - - - - - - - - - -

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档