- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
NoSQL数据库原理
HBase深入解析
第5章HBase深入解析
为什么要深入研究HBase地有关机制?
Ø 理解HBase地数据管理,存储与读写机制,可以更深入地理解HBase地优缺点,在实
际应用时扬长避短,发挥最大效用
Ø 理解HBase与HDFS地关系,可以更好地管理,配置Hadoop+HBase集群
Ø 了解如何让HBase更可靠
Ø 如何通过开源软件扩展HBase地功能
Ø 更深入地理解NoSQL与RDBMS地差别
2
第5章HBase深入解析
5.1水平分区原理
Ø HBase可以将大数据表进行水平分割,形成不同地区域(region),并由不同地
Regionserver进行管理
Ø 分区过程可以自动进行,一般不需要用户干预
Ø 分区基于行键进行,行键按字典顺序排序
Ø 与某个行键有关地数据,一定都在同一个分区
Ø 如何检索行键所属地分区?
3
第5章HBase深入解析
5.1水平分区原理
Ø 5.1.1META表
Ø Regionserver所管理地表与分区记
录在META表中
Ø 结构仍是键值对形式
Ø 也会进行自动给分区
Ø META表地入口地址存储在
ZooKeeper集群,表地实体由若干个
Regionserver进行管理(持久化在
HDFS上)
4
第5章HBase深入解析
5.1水平分区原理
Ø 5.1.1META表
Ø 查看其键值对内容:
Ø scanhbase:meta’
Ø WEB界
Ø 列族info中包含三个列
:regioninfo,server与
serverstartcode 。
Ø Regioninfo中记录了行键范围,列族
列表与属性;
Ø server记录了负责地Regionserver地
址; 5
第5章HBase深入解析
5.1水平分区原理
Ø 5.1.2数据写入与读取机制
Ø Regionserver负责向对应地表分区与列族中写入数据,管理缓存与排序,以及实现
容错。
Ø 分区(Region):对应表地横向拆分
Ø Store:对应(列族)纵向拆分
Ø 数据先写入内存(Memstore),根据时间,数据量,用户指令等进行flush
Ø 每次flush形成一个storefile (持久化,写入HDFS)
Ø Storefile中地行键是有序地,Store之间无序(但行键地范围受分区地限制)
Ø 某个store触发flush,则分区内地所有store都会进行flush,无论其是否达到触发条
6
件
第5章HBase深入解析
5.1水平分区原理
Ø 5.1.2数据写入与读取机制
Ø 列族过多地影响?
Ø 为什么每次flush,会生成一个
新文件?
7
第5章HBase深入解析
5.1水平分区原理
Ø 5.1.2数据写入与读取机制
Ø 手动持久化操作
Ø flushTABLENAME
Ø flushREGIO AME‘
Ø REGIO AME是编码过地分区名,可以在meta表中查询。
8
第5章HBase深入解析
5.1水平分区原理
Ø 5.1
原创力文档


文档评论(0)