- 6
- 0
- 约1.35万字
- 约 46页
- 2017-09-16 发布于浙江
- 举报
面向运维人员的IT技术系列课程
大数据系列培训
第三讲
HBase介绍
讲师:集团系统集成公司 李文鸿
2015年03月
应用引领,快速支撑,助力网络运维转型
应用引领,快速支撑,助力网络运维转型
本节的主要内容和课程目标
主要内容:
• HBase数据模型
• HBase系统架构
• HBase安装部署
• HBase访问方式
课程目标:
通过本次学习对HBase有一个全面、综合的了解,掌握
HBase的特点、数据模型、体系结构及基本操作。
应用引领,快速支撑,助力网络运维转型
议题
HBase简介
Hbase架构设计
Hbase安装部署
Hbase Shell命令行
Hbase Java API编程
应用引领,快速支撑,助力网络运维转型
Hbase发展历史
2006年11月:Google发布BigTable论文。
2007年2月:Hbase宣布在Hadoop项目中成立。
2007年10月:Hbase第一个“可用版本”(Hbase 0.15.0)。
2008年1月:Hadoop成为Apache 的顶级项目,Hbase成为
Hadoop的子项目。
2008年10月:Hbase 0.18.1发布。
2009年1月:Hbase 0.19.0发布。
2009年9月:Hbase 0.20.0发布,性能有明显提升。
2010年5月:Hbase成为Apache 的顶级项目。
2011年1月:Hbase 0.90.0发布,稳定性和持久性有所提升。
2011年年中:Hbase 0.92.0发布,支持协处理器和安全控制。
目前最新稳定版本为Hbase 1.0.x
应用引领,快速支撑,助力网络运维转型
Hbase关系图
• HDFS:高可靠的底层存储支持
• MapReduce:高性能的计算能力
• Zookeeper :稳定服务和failover机制
• PigHive:高层语言支持,便于数据统计
• Sqoop :提供RDBMS数据导入,便于传统数据库向Hbase迁移
应用引领,快速支撑,助力网络运维转型
Hbase表特点
大:一个表可以有数十亿行,上百万列;
无模式:每行都有一个可排序的主键和任意多的列,列可以根
据需要动态的增加,同一张表中不同的行可以有截然不同的列;
面向列:面向列(族)的存储和权限控制,列(族)独立检索;
稀疏:空(null)列并不占用存储空间,表可以设计的非常稀疏;
数据多版本:每个单元中的数据可以有多个版本,默认情况下
版本号自动分配,是单元格插入时的时间戳;
数据类型单一:Hbase中的数据都是字符串,没有类型;
应用引领,快速支撑,助力网络运维转型
Hbase数据模型
• 表(table ):Hbase用表来组织数据
• 行(row):表里的数据按行存储
• 列族(column family ):行里的数据按照列族分组
• 列限定符(column qualifier ):列族里的数据通过列限定符定位
•
原创力文档

文档评论(0)