- 1、本文档共19页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
Cloud Operating System - Unit 05: 雲端分散式Hadoop實驗 -I Cloud Operating System Unit 05 雲端分散式Hadoop實驗 -I M. S. Jian Department of Computer Science and Information Engineering National Formosa University Yunlin, Taiwan, ROC 軟體平台 就是將一個工作分成多個並傳送到多個節點(Node)處理 將各個Node的結果再重新結合統整成最後的結果 Hadoop and MapReduce * Cloud Operating System - Unit 05: 雲端分散式Hadoop實驗 -I U05-* Java開發 自由軟體 為Apache軟體基金會的top level project Hadoop * Cloud Operating System - Unit 05: 雲端分散式Hadoop實驗 -I U05- * Algorithm Method Hadoop Map/Reduce是一個易於使用的軟體平台,以MapReduce為基礎的應用程序 能夠運作在由上千台PC所組成的大型叢集上,並以一種可靠容錯的方式平行處理上Peta-Bytes數量級的資料集 MapReduce * Cloud Operating System - Unit 05: 雲端分散式Hadoop實驗 -I U05- * 巨量 –擁有儲存與處理大量資料的能力 ?經濟 –可以用在由一般PC所架設的叢集環境內 ?效率 –籍由平行分散檔案的處理以致得到快速的回應 ?可靠 –當某節點發生錯誤,系統能即時自動的取得備份資料以及佈署運算資源 特徵 * Cloud Operating System - Unit 05: 雲端分散式Hadoop實驗 -I U05- * 大規模資料集 可拆解 Text tokenization Indexing and Search Data mining machine learning 特徵 * Cloud Operating System - Unit 05: 雲端分散式Hadoop實驗 -I U05- * Functional Programming : Map Reduce –map(...) : [ 1,2,3,4 ] – (*2) - [ 2,4,6,8 ] –reduce(...): [ 1,2,3,4 ] - (sum) - 10 對應演算法中的Divide and conquer 將問題分解成很多個小問題之後,再做總和 MapReduce理論觀念 * Cloud Operating System - Unit 05: 雲端分散式Hadoop實驗 -I U05- * Google v.s. Apache Develop Group Google Apache Sponsor Google Apache Resource Open Document Open Source File System GFS HDFS Storage System Big-Table Hbase Algorithm Method MapReduce MapReduce O.S Linux Linux/ GPL * Cloud Operating System - Unit 05: 雲端分散式Hadoop實驗 -I U05- * HDFS(HadoopDistributed File System) GFS, DFS (Distributed File System) * Cloud Operating System - Unit 05: 雲端分散式Hadoop實驗 -I U05- * Hadoop環境名詞解釋 Job –任務 ? Task –工作 ? JobTracker –任務分派者 ? TaskTracker –工作的執行者 ? Client –發起任務的客戶端 ? Map –對應 ? Reduce –彙整 Namenode –名稱節點 ?Datanode –資料節點 ?Namespace –名稱空間 ?Replication –副本 ?Blocks –檔案區塊 (64M) ?Metadata –屬性資料 * Cloud Operating System - Unit 05: 雲端分散式Hadoop實驗 -I U05- * 資料夾名稱 說明 bin 各執行檔,例如: start-all.sh conf 預設的設定檔目錄(可更改),例如: hadoop-env.sh docs Hadoop API
您可能关注的文档
- 中经网统计数据库.pdf
- 中美北京设计顾问-网络预订表格.doc
- 中美篮球进攻战术体系研究-沈阳体育学院学报.pdf
- 中考现代文阅读答题思路方法和技巧.doc
- 中英人寿助跑10K联赛.ppt
- 中荷联合主题研究项目合作.doc
- 串列矩阵相乘.ppt
- 临床医学博士研究生培养方案.doc
- 临床学院就业简报-海南医学院.doc
- 丹麦哈农私立中学国际夏令营.pdf
- 第三单元解决问题的策略 三年级下册数学高频考点重难点讲义(苏教版)(1).docx
- 4.4 解比例 数学六年级下册同步培优讲义(苏教版).docx
- 第四单元《根据方向与距离确定物体位置》(教案)五年级下册数学青岛版.docx
- (奥数典型题)第三讲 分解质因数 五年级下册数学思维拓展提升讲义(人教版).docx
- 2.2:2、5、3的倍数-人教版五年级数学下册第二单元:因数和倍数.docx
- 第六单元正比例和反比例 六年级下册数学高频考点重难点讲义(苏教版).docx
- 第二单元除数是一位数的除法 三年级下册数学高频考点重难点讲义(人教版).docx
- 第二单元-认识三角形和四边形 四年级数学下册提升(北师大版).docx
- 第一单元观察物体(三)五年级下册数学高频考点重难点讲义(人教版).docx
- 第九单元 数学广角—推理 二年级数学下册重难点知识点(人教版).docx
文档评论(0)