3-课件hbase介绍.pdfVIP

  • 6
  • 0
  • 约1.35万字
  • 约 46页
  • 2017-09-16 发布于浙江
  • 举报
面向运维人员的IT技术系列课程 大数据系列培训 第三讲 HBase介绍 讲师:集团系统集成公司 李文鸿 2015年03月 应用引领,快速支撑,助力网络运维转型 应用引领,快速支撑,助力网络运维转型 本节的主要内容和课程目标 主要内容: • HBase数据模型 • HBase系统架构 • HBase安装部署 • HBase访问方式 课程目标: 通过本次学习对HBase有一个全面、综合的了解,掌握 HBase的特点、数据模型、体系结构及基本操作。 应用引领,快速支撑,助力网络运维转型 议题 HBase简介 Hbase架构设计 Hbase安装部署 Hbase Shell命令行 Hbase Java API编程 应用引领,快速支撑,助力网络运维转型 Hbase发展历史  2006年11月:Google发布BigTable论文。  2007年2月:Hbase宣布在Hadoop项目中成立。  2007年10月:Hbase第一个“可用版本”(Hbase 0.15.0)。  2008年1月:Hadoop成为Apache 的顶级项目,Hbase成为 Hadoop的子项目。  2008年10月:Hbase 0.18.1发布。  2009年1月:Hbase 0.19.0发布。  2009年9月:Hbase 0.20.0发布,性能有明显提升。  2010年5月:Hbase成为Apache 的顶级项目。  2011年1月:Hbase 0.90.0发布,稳定性和持久性有所提升。  2011年年中:Hbase 0.92.0发布,支持协处理器和安全控制。 目前最新稳定版本为Hbase 1.0.x 应用引领,快速支撑,助力网络运维转型 Hbase关系图 • HDFS:高可靠的底层存储支持 • MapReduce:高性能的计算能力 • Zookeeper :稳定服务和failover机制 • PigHive:高层语言支持,便于数据统计 • Sqoop :提供RDBMS数据导入,便于传统数据库向Hbase迁移 应用引领,快速支撑,助力网络运维转型 Hbase表特点  大:一个表可以有数十亿行,上百万列;  无模式:每行都有一个可排序的主键和任意多的列,列可以根 据需要动态的增加,同一张表中不同的行可以有截然不同的列;  面向列:面向列(族)的存储和权限控制,列(族)独立检索;  稀疏:空(null)列并不占用存储空间,表可以设计的非常稀疏;  数据多版本:每个单元中的数据可以有多个版本,默认情况下 版本号自动分配,是单元格插入时的时间戳;  数据类型单一:Hbase中的数据都是字符串,没有类型; 应用引领,快速支撑,助力网络运维转型 Hbase数据模型 • 表(table ):Hbase用表来组织数据 • 行(row):表里的数据按行存储 • 列族(column family ):行里的数据按照列族分组 • 列限定符(column qualifier ):列族里的数据通过列限定符定位 •

文档评论(0)

1亿VIP精品文档

相关文档