- 10
- 0
- 约2.29千字
- 约 16页
- 2016-10-26 发布于天津
- 举报
Hadoop原理与实务应用.ppt
Hadoop原理與實務應用 報告人:魏宏吉 大綱 何謂Hadoop Hadoop架構 HDFS架構 Hadoop MapReduce運作原理 Demo 1.何謂Hadoop Hadoop是由Google雲端架構得到啟發而開始的開放原始碼計劃,目前有許多組織參與Hadoop的研究開發,並以Hadoop做為雲端運算的平台。 Hadoop是以java寫成,可以提供大量資料的分散式運算環境,而且Hadoop的架構是由Google發表的BigTable及Google File System等文章提出的概念實做而成,所以跟Google內部使用的雲端運算架構相似。 Google Hadoop MapReduce Hadoop MapReduce GFS HDFS BigTable HBase Hadoop可分為運算及儲存兩大部份,前者由Map Reduce負責,後者則由HDFS負責。 2.Hadoop架構 Hadoop Core HDFS HBase MapReduce Hadoop系統架構圖 3. HDFS架構 Hadoop Distributed File System (HDFS) 將分散的儲存資源整合成一個具容錯能力、高效率且超大容量的儲存環境,在Hadoop系統中大量的資料和運算時產生的暫存檔案,都是存放在這個分散式的檔案系統上。 HDFS儲存的資料分散在不同的機器上,所以應用程式必須透過網路進入多台機器讀取資料,因此容易造成網路的阻塞,所以HDFS提供一個介面,讓應用程式將自己移動到資料存放的節點附近,除了可以減少網路負載,也可以增加系統的處理能力。 HDFS是master/slave架構,由三種角色組成 (1)名稱節點(Name node) 負責檔案系統中各個檔案屬性權限等資訊的管理及儲存 (2)資料節點(Data node) 處理使用者存取資料塊的請求,並定時回報資料塊之狀態給名稱節點 (3)第二名稱節點 3. HDFS架構 名稱節點 第二名稱節點 資料節點 HDFS的基本儲存單位稱為資料塊 HDFS中的檔案會被切割成一個循環的資料塊串列 而這些資料塊將會分散的儲存在每個資料節點上 3.1. HDFS的儲存方式 名稱節點 第二名稱節點 資料節點 2 2 3 4 1 3 4 1 檔案 使用者若需要存取HDFS上的檔案時,必須經過下列三個步驟 (1)使用者先將所要存取的資料名稱送至名稱節點 (2)名稱節點回傳該資料的相關資料給使用者 (3)使用者根據這些相關資料儲存資料節點中的資 料塊 3.2 HDFS的檔案存取 名稱節點 第二名稱節點 3 4 1 2 (1)檔案名稱 (2)檔案資料 (3)存取資料 5 資料節點 名稱節點失敗 由第二名稱節點來取代名稱節點 資料節點失敗 當某些資料節點發生錯誤時會選擇另一個包含該資料塊副本的資料節點進行存取。 3.3. HDFS的容錯機制 4. Hadoop MapReduce運作原理 Hadoop Map/Reduce是一個資料平行處理的程式設計模式,根據此模式開發程式,便可以自動在Ha- doop上達到平行化,以便分析巨量的數據資料。 4. Hadoop MapReduce運作原理 MapReduce可以分兩個步驟進行 (1)Map 透過一個Map函式將一組鍵/值(Key/Value)映射到暫時產生的另一組中間值/值,而此一中間值/值會傳送到Reduce函式。 (2)Reduce 將具有相同中間鍵的中間值會整在一起,進而產生所需的結果。 4. Hadoop MapReduce運作原理 Split Mapping Reducing Output Result map reduce Cat Dog Dog Pig Pig Cat Cat,1 Cat,1 Dog,1 map Pig,1 Cat,1 Dog,1 map Cat,1 Cat,1 Pig,1 Cat,1 Cat,1 reduce Dog,1 Dog,1 reduce Map Task1 Pig,1 Pig,1 Cat,2 Dog,2 Pig,2 Map Task2 Map Task3 Reduce Task1 Reduce Task2 Reduce Task3 File 4. Hadoop MapReduce運作原理 圖片來源: /2011/03/starting-sub-sandwitch-business.html 4.1 Hadoop MapReduce的特性 提供高可靠度的運算 各個資料片段沒有相依性,若有某節點發生錯誤 則Master會將該節點的工作重新分配給其他節點 去處理。 提供容錯機制 Master會監控Slav
您可能关注的文档
- 2.1.3函数-映射.ppt
- 映射与函数-第一章.ppt
- 云计算第六组负责人刘晓龙组员张宇轩李超廖金铭.ppt
- Somethingaboutweb3.0.ppt
- 7.3Romberg积分.ppt
- 珍藏那时刻,最美丽的你,最幸福的笑容.doc
- 成人声乐考级曲目(一).doc
- 2016年10月19日新书通报.doc
- 托福词汇想娶洋老婆的20个俚语.doc
- 北外网院高起专、高起本入学考试英语题目汇编.doc
- 广东省广州省实验中学教育集团2025-2026学年八年级上学期期中考试物理试题(解析版).docx
- 广东省广州大学附属中学2025-2026学年八年级上学期奥班期中物理试题(解析版).docx
- 广东省广州市第八十六中学2025-2026学年八年级上学期期中物理试题(含答案).docx
- 广东省广州市第八十九中学2025-2026学年八年级上学期期中考试物理试题(解析版).docx
- 广东省广州市第二中学2025-2026学年八年级上学期期中考试物理试题(含答案).docx
- 广东省广州市第八十六中学2025-2026学年八年级上学期期中物理试题(解析版).docx
- 广东省广州市第八十九中学2025-2026学年八年级上学期期中考试物理试题(含答案).docx
- 广东省广州市第二中学2025-2026学年八年级上学期期中考试物理试题(解析版).docx
- 2026《中国人寿上海分公司营销员培训体系优化研究》18000字.docx
- 《生物探究性实验教学》中小学教师资格模拟试题.docx
最近下载
- 毕业论文(设计)-小型液压升降平台机械工程及自动化.doc VIP
- 在线网课学习课堂《现场生命急救知识与技能(南昌大学 )》单元测试考核答案.docx VIP
- 洛可可风格建筑.ppt.ppt VIP
- 鳞状细胞癌学习课件.pptx VIP
- 国企优化整合方案汇编.docx VIP
- 《农机电器设备使用维护》课件——项目一:农机电气系统基础.pptx VIP
- 开工第一课春节复工安全生产培训ppt.pptx VIP
- 宝可梦 Let's Go!皮卡丘1.02版switch大气层系统游戏修改代码.docx VIP
- 《农机电器设备使用维护》课件——农机电气系统的组成及特点.pptx VIP
- 工伤职工停工留薪期分类目录模板范本.pdf VIP
原创力文档

文档评论(0)