第9章資料處理模型.pptVIP

下载本文档

5
0
约3.42千字
约 25页
2017-05-02 发布于天津
举报

第9章資料處理模型.ppt

第9章　資料處理模型 1 大綱 9.1 　簡介 9.2 　MapReduce 9.3 　Hadoop MapReduce 2 有多少資料？ Google一天處理20 PB (2008年) Wayback機器處理 3 PB且每月增加100 TB (2009年3月) Facebook有2.5 PB的用戶資料且每天增加15 TB (2009年4月) eBay有6.5 PB的用戶資料且每天增加50 TB (2009年5月) CERN的LHC 每年產生15 PB資料想想看未來…… 3 各個擊破 4 假使採用平行化？困難，因為… 我們不曉得工作被分配到的工作順序我們不曉得工作單位之間是否會互相中斷或干擾我們不曉得「共享資料」該如何被不同工作單位存取的順序因此，我們需要：號誌上鎖、解鎖條件變數等待、通知、廣播障礙仍有許多問題：死結、活結、競賽情況… 哲學家進餐問題（Dining philosophers）、睡著的理髮師問題（Sleeping barbers）、抽菸者問題（Cigarette smokers）… 5 現有方式資料處理模型共享記憶體，如pthreads 訊息傳遞介面，如MPI 設計模式主－從生產者－消費者共享工作佇列 6 問題真的解決了嗎？「一致性」是難以控制的因素「一致性」甚至變得更加地難以控制在資料中心的規模上（尤其是跨越多個資料中心

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

第9章資料處理模型.pptVIP