- 1、本文档共64页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
飞龙在天 ——Hbase
@八斗学院
飞龙在天——Hbase
O u t L i n e
HBase基础
【实践】HBase搭建
【实践】Hbase Shell
【实践】Hbase的Python操作
八斗
— — 八 斗 大 数 据 , 盗 版 必 究— —
飞龙在天——Hbase
H b a s e 定 义
• HBase是一个开源的非关系型分布式数据库 (NoSQL),它 了谷歌的BigTable建模,实现
的编程语言为 J a。
• 是Apache软件 的Hadoop项目的一部分,运行于HDFS文件系统之上,因此可以容错地存
储海量稀疏的数据。
• 特性:
– 高可靠
– 高并发读写
– 面向列
– 可伸缩
八斗
– 易构建
— — 八 斗 大 数 据 , 盗 版 必 究— —
飞龙在天——Hbase
行 存 储 v s 列 存 储
• 行存储:
– 优点:写入一次性完成,保持数据完整性
– 缺点:数据读取过程中产生冗余数据,若有少量数据可以忽略
• 列存储
– 优点:读取过程,不会产生冗余数据,特别适合对数据完整性要求不高的大数据领域
– 缺点:写入效率差,保证数据完整性方面差
八斗
— — 八 斗 大 数 据 , 盗 版 必 究— —
飞龙在天——Hbase
H b a s e 优 势
• 海量数据存储
• 快速随机
• 大量写操作的应用。
八斗
— — 八 斗 大 数 据 , 盗 版 必 究— —
飞龙在天——Hbase
H b a s e 应 用 场 景
• 互联网搜索引擎数据存储
• 海量数据写入
• 消息中心
• 内容服务系统(schema-free)
• 大表复杂 度索引
• 大批量数据读取
八斗
— — 八 斗 大 数 据 , 盗 版 必 究— —
飞龙在天——Hbase
H b a s e 数 据 模 型
• RowKey:是Byte array,是表中每条记录的“主键”,方便快速查找,Rowkey的设计非常重要。
• Column Family:列族,拥有一个名称(string),包含一个或者多个相关列
• Column:属于某一个columnfamily,familyName:columnName,每条记录可动态添加
八斗
• Version Number:类型为Long,默认值是系统时间戳,可由用户自定义
• Value(Cell):Byte array
— — 八 斗 大 数 据 , 盗 版 必 究— —
飞龙在天——Hbase
H b a s e 数 据 模 型
八斗
— — 八 斗 大 数 据 , 盗 版 必 究— —
飞龙在天——Hbase
H b a s e 数 据 模 型
三维有序!
八
• {rowkey = {family = {qualifier = {version = value}}}}
• a:cf1:bar:1368394583:7
— — 八 斗 大 数 据 , 盗 版 必 究— —
• a:cf1:foo:1368394261:hello
飞龙在天——Hbase
H b a s e 数 据 模 型
Rowkey
文档评论(0)