- 31
- 0
- 约3.07千字
- 约 18页
- 2018-10-05 发布于天津
- 举报
Hadoop生态系统3、Mapreduce(分布式计算框架).ppt
陈 辉 2016年3月 --hadoop生态系统 Page ? * Hadoop生态系统 1、Hadoop生态系统概况 Hadoop是一个能够对大量数据进行分布式处理的软件框架。具有可靠、高效、可伸缩的特点。Hadoop的核心是HDFS和Mapreduce,hadoop2.0还包括YARN。 Page ? * Hadoop生态系统 2、 HDFS(Hadoop分布式文件系统) 源自于Google的GFS论文,发表于2003年10月,HDFS是GFS克隆版。是Hadoop体系中数据存储管理的基础。它是一个高度容错的系统,能检测和应对硬件故障,用于在低成本的通用硬件上运行。 HDFS简化了文件的一致性模型,通过流式数据访问,提供高吞吐量应用程序数据访问功能,适合带有大型数据集的应用程序。 Page ? * Hadoop生态系统 2、 HDFS(Hadoop分布式文件系统) Page ? * Hadoop生态系统 2、 HDFS(Hadoop分布式文件系统) Client:切分文件;访问HDFS;与NameNode交互,获取文件位置信息;与DataNode交互,读取和写入数据。 NameNode:Master节点,在hadoop1.X中只有一个,管理HDFS的名称空间和数据块映射信息,配置副本策略,处理客户端请求。 DataNod
您可能关注的文档
- 080706化工过程机械学科攻读硕士学位研究生-山东大学机械工程学院.doc
- 10月自考英语(二)模拟试题及答案-辽宁自考.doc
- 1水冷散热器原理2水冷散热器结构3水冷优点与缺点-热设计.PDF
- 2009年油气重点实验室年报-构造与油气资源教育部重点实验室-中国.doc
- 2016JC036科研机构建设任务书-数理与信息工程学院-浙江师范大学.doc
- 2018博士后招收需求报送系统操作说明.ppt.ppt
- 2018年暑期培训班课表.doc-陕西省材料分析研究中心.doc
- 3.1处理机调度的层次高级调度高级调度又称为作业调度或长程调度.ppt
- 3.3上行链路的容量性能分析-Read.doc
- 3标准制定的目的和意义-中国电力企业联合会.doc
- 《2026 苏教版七年级下册生物精品 解决园林观赏植物习性混淆问题(PPT+教案+练习)》.pptx
- 《2026 苏教版七年级下册美术精品 解决园林透视表现错误问题(PPT+教案+练习)》.pptx
- 分拣业务承揽合同.docx
- 《2026 苏教版七年级下册语文同步 10类园林文化散文阅读训练(PPT+教案+练习)》.pptx
- 《2026 苏教版七年级下册英语同步 68个园林相关英语词汇梳理(PPT+教案+练习)》.pptx
- 《2026 苏教版七年级下册语文精品 解决苏州园林艺术特色分析偏差问题(PPT+教案+练习)》.pptx
- 人教部编版六年级语文上册第一单元教学反思.docx
- 施工现场环境保护措施.docx
- 《2026 苏教版五年级上册体育精品 解决羽毛球挥拍动作不标准问题PPT+配套教案+专项练习》.pptx
- 教科版小学科学家校合作推进计划.docx
原创力文档

文档评论(0)