- 324
- 0
- 约1.92万字
- 约 50页
- 2022-09-04 发布于甘肃
- 举报
Hadoop介绍
任务背景
大数据时代下,针对大数据处理的新技术也在不断地开发和运用中,并逐渐成为数据处理挖掘行业广泛使
用的主流技术之一。在大数据时代,Hadoop作为处理大数据的分布式存储和计算框架,在国内外大、中、
小型企业中已得到了广泛应用。学习Hadoop技术是从事大数据行业工作必不可少的一步。
本章将主要介绍Hadoop分布式框架的理论知识。
• 首先介绍Hadoop框架及其发展历史、特点,并重点讲解Hadoop 的3大核心组件HDFS 、YARN和
MapReduce 。
• 接着对Hadoop生态系统中的组件进行简单的介绍,包括组件的特点和应用。
• 最后简要介绍Hadoop 的应用场景。
2
目录
1 认识Hadoop框架
2 了解Hadoop核心组件
3 了解Hadoop生态系统
4 了解Hadoop应用场景
3
任务描述
在使用Hadoop 的核心组件之前,首先需要对Hadoop框架的理论知识有一定的了解。
本小节的任务是了解Hadoop框架及其发展历史、特点,带领读者走进Hadoop 。
4
什么是Hadoop
Hadoop 由Apache基金会开发, 开源的 、 可靠的 、 可扩展的 、
用于分布式计算 的分布式系统基础架构或框架。
5
什么是Hadoop
Hadoop
分布式文件 可扩展、高容错、高性能的分布式文件系统
系统 负责数据的分布式存储和备份
HDFS
Hadoop
框架核心
分布式
Map (映射)
计算框架
Reduce (规约)
MapReduce
6
了解Hadoop发展历史
7
了解Hadoop的特点
高可靠性 高扩展性 高效性 高容错性
可构建在 Hadoop基本框架
低成本
廉价机
您可能关注的文档
最近下载
- 2025 AI智能体的实践应用:评估与治理基础框架白皮书(中文).docx
- 2025-2026学年高一语文下学期开学摸底考试试题及答案详解(含范文参考).docx VIP
- 混凝土排水管道基础及接口 04S516.pdf VIP
- 基于LABVIEW的虚拟频谱分析仪设计.pdf VIP
- 潍柴WP7NG系列天然气发动机维修手册.PDF
- 数据结构期末复习题.docx VIP
- 2026年苏州健雄职业技术学院单招职业技能考试参考题库及答案详解.docx VIP
- 清洁能源领域:氢能企业的组织架构与职责.docx VIP
- T∕SIA 065-2025 智能体行为安全要求.pdf VIP
- 22G101三维图集合集.pdf VIP
原创力文档

文档评论(0)