Hadoop企业级应用实战之Apache-Hadoop介绍.pdfVIP

  • 4
  • 0
  • 约6.94千字
  • 约 36页
  • 2020-09-10 发布于福建
  • 举报

Hadoop企业级应用实战之Apache-Hadoop介绍.pdf

特此声明 本视频由whoami博主(博客:) Hadoop十周年庆开始公益录制,内容涉及 《Enterprise_Hadoop_Solutions》,声明此 教程使用图片大部分来自网络,版权属于广大 网友;任何个人或企业未经授权不得作商业用 途。想要持续关注更新或参与讨论请加入QQ 群:457710636 ! 第一季SQL-on-Hadoop 写在Hadoop十周年纪念 Hadoop平台架构-硬件篇 - /2016/01/26/Hadoop-Hardware-Planning/ Hadoop平台架构-存储篇 - /2016/01/25/Hadoop-Disk-Planning/ 课程内容 新浪微博 @Mr-Robot1992 第一季预览 D:\ ENTERPRISE_HADOOP_SOLUTIONS ├─0 、Hadoop企业级应用实战之Centos安装Hadoop存储规划 ├─ 1、Hadoop企业级应用实战之Apache-Hadoop介绍 ├─2、Hadoop企业级应用实战之Hadoop前世今生 ├─3、Hadoop企业级应用实战之动物园管理员zookeeper ├─4 、Hadoop企业级应用实战之Hadoop集群构建思考_CDH集群构建 ├─5、Hadoop企业级实战之集群资源分配和进阶使用 ├─6、Hadoop企业级应用实战之SQL-on-Hadoop │ ├─Drill │ ├─ Hbase-phoenix │ ├─Hive │ │ └─tez │ ├─Impala │ ├─presto │ ├─sparksql │ ├─Cassandra │ └─Tez ├─Other │ ├─DT群二维码 │ ├─V 电影-短片 └─大数据十周年纪念日 - 1、此公益性质教程,要求参与人员,对linux有基本的使用经历! - 2、此公益性质教程,要求参与人员,对linux有基本的使用经历! - 3、此公益性质教程,要求参与人员,对linux有基本的使用经历! Apache Hadoop介绍 作者:whoami 走向分布式 一个系统走向分布式,一定有其不得不为的理由。可扩展性是最常见的理由之一。 我先简单的将“可伸缩” 的需求分成两种: 1、Data Scalability: 单台机器的容量不足以(经济的) 承载所有资料,所以需要 分散。如:NoSQL 2、Computing Scalability: 单台机器的运算能力不足以(经济的) 及时完成运算所 以需要分散。如:科学运算。不管是哪一种需求,在决定采用分布式架构时, 就几乎注定要接受一些牺牲: (1). 牺牲效率:网路延迟与节点间的协调,都会降低执行效率。 (2). 牺牲AP 弹性:有些在单机上能执行的运算,无法轻易在分布式环境中完成。 (3). 牺牲维护维运能力:分散式架构的问题常常很难重现,也很难追踪.另外,跟单机系 统一样,也有一些系统设计上的tradeoffs(权衡) (4). CPU 使用效率优化或是IO 效率优化 (5). 读取优化或是写入优化 (6). 吞吐率优化或是网络延迟优化 (7). 资料一致性或是资料可得性,选择了不同的tradeoff ,就会有

文档评论(0)

1亿VIP精品文档

相关文档