- 1、本文档共67页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
? 1
? 1
? 1
? 1
第10章开源云计算系统介绍
3
3
【教学内容】
开源云计算系统Hadoop
开源云计算软件Eucalyptus
开源虚拟化云计算平台OpenStack
【教学要求】
掌握Hadoop的体系架构、技术原理和应用方案
掌握Eucalyptus的体系架构、技术原理和应用方案
掌握OpenStack的体系架构、技术原理和应用方案
【重点难点】
Hadoop的分布式计算框架MapReduce、OpenStack的核
.心开源项目(Nova、Swift Glance)
主要内容
-?10.1开源云计算系统Hadoop
10.2开源云计算软件Eucalyptus
10.3开源虚拟化云计算平台OpenStack
? Hadoop 背景介绍
Hadoop是有Apache软件基金会下的一个开源分布式计算平台。
Hadoop以分布式文件系统HDFS和MapReduce ( Google MapReduce的开
源实现)为核心,为用户提供了系统底层细节透明的分布式基础架构。
HDFS的高容错性、高伸缩性等优点允许 用户将Hadoop部署在低廉的硬件上,形 成分布式系统。
MapReduce分布式编程模型允许用户在不 了解分布式系统底层细节的情况下开发 并行应用程序。
?
? Hadoop2.X的生态系统
?
? Hadoop2.X的生态系统
?Hadoop
?Hadoop背景介绍
Hadoop目前除了社区版,还有众多厂商的发行版本,如华为发行版、 Intel发行版、Cloudera发行版(CDH )、Hortonworks发行版(HDP )、 MapR等,所有这些发行版均是基于Apache Hadoop衍生出来的。
cloudera ?最成型的发行版本,拥有最多的咅階案例;提供强大的部 署、管理和监控工具。
?不拥有任何私有(非开源)修改地使用了 100%开 u点統1
、〃 丄」d 丄口 j亠 Hortonworks
源Apache Hadoop的唯一提供商。
AAAPR?为了获取更好的性能和易用性而支持本地UNIX文 件系统而不是HDFS (使用非开源的组件)。
AAAPR
Hadoop是一个能够对大量数据进行分布式处理的软件框架,具有 可靠、高效、可伸缩的特点。Hadoop的核心是HDFS和MapReduce ,在Hadoop2.X中还包括YARN。
Ambari
(安装部署工具)
MapReduce(高线计算)(*睡羿金憫黑歪)
MapReduce
(高线计算)
(*睡羿金憫黑歪) 」od$,ooz
Oozie(作业流调度系统)
Tez(DAG计算)
YARN
(分布式计算?R)
E?2S*IAJ—? 岑 根
E
?2
S*
IAJ
—
? 岑 根
QI
Spark
(内存计算)
?Hadoop2.X
?Hadoop2.X的生态系统
8
8
?Hadoop2.X
?Hadoop2.X的生态系统
8
8
?Hadoop2.X
?Hadoop2.X的生态系统
Hive ( STHadoop的数据仓库)用于
Hive ( STHadoop的数据仓库)
Hbase (分布式列存数据库)?
Hbase (分布式列存数据库)
Pig (基于
Pig (基于Hadoop的数据流系统)
Sqoop (数据同步工具
Sqoop (数据同步工具)
,用于Apache Hadoop和结构化数据存
储库如关系型数据库之间的数据传输。
Flume (
Flume (日志收集工具)
高效搜集、汇总、移动大量日志数据。
Zookeeper (分布式协作服务
Zookeeper (分布式协作服务)
Mahout (数据挖掘算法库)
Spark
? 一种集中服务,用于维护配置信息、
、提供分布式同步以及提供分组服务。
?一种基于Hadoop的机器学习和数据挖掘的 分布式计算框架算法集,实现了多种 MapReduce模式的数据挖掘算法。
? 一个开源数据分析集群计算框架。与
Hadoop—样用于构建大规模、低延时的
数据分析应用。
?
? PAGE #
?
? PAGE #
?Hadoop2.X的生态系统
Storm?属于流处理平台,多用于实时计算并更新数据库;也可以用于 连续计算”对数据流做连续查询;还可以用于分布式RPC” 以并行的方式运行大型的运算。
Storm
Shark?即Hive on Spark ,—个专门为Spark打造的大规模数据仓库 系统,兼容Apache Hiveo无需修改现有的数据或者查询, 就可以用100倍的速度执行Hive QLo
Shark
Phoenix? 一个构建在Apache HBase之上的SQL中间层,完全使用Java编 写,提供了一个客户端可嵌入的JDBC驱动。Ph
您可能关注的文档
- (本科)Excel在财务中的应用教学ppt课件(完整版)电子教案.docx
- 2020-2021学年度第二学期八年级物理试题及参考答案.docx
- 2021广东一模化学试题附答案.docx
- 2021年法律职业资格考试卷一(刑法)历年真题试卷汇编(含答案解析).docx
- 2022年全国硕士研究生招生考试302数学二预测卷1和答案解析.docx
- 2022年全国硕士研究生招生考试302数学二预测卷8和答案解析.docx
- 2022年全国硕士研究生招生考试数学三303预测卷4和答案解析.docx
- 2022年西工大附中中考九模物理试题.docx
- Excel-函数用法解析.docx
- java初级教程 第一章 认识java语言.docx
文档评论(0)