NoSQL数据库原理-HBase深入解析.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
NoSQL数据库原理 HBase深入解析 第5章HBase深入解析 为什么要深入研究HBase地有关机制? Ø 理解HBase地数据管理,存储与读写机制,可以更深入地理解HBase地优缺点,在实 际应用时扬长避短,发挥最大效用 Ø 理解HBase与HDFS地关系,可以更好地管理,配置Hadoop+HBase集群 Ø 了解如何让HBase更可靠 Ø 如何通过开源软件扩展HBase地功能 Ø 更深入地理解NoSQL与RDBMS地差别 2 第5章HBase深入解析 5.1水平分区原理 Ø HBase可以将大数据表进行水平分割,形成不同地区域(region),并由不同地 Regionserver进行管理 Ø 分区过程可以自动进行,一般不需要用户干预 Ø 分区基于行键进行,行键按字典顺序排序 Ø 与某个行键有关地数据,一定都在同一个分区 Ø 如何检索行键所属地分区? 3 第5章HBase深入解析 5.1水平分区原理 Ø 5.1.1META表 Ø Regionserver所管理地表与分区记 录在META表中 Ø 结构仍是键值对形式 Ø 也会进行自动给分区 Ø META表地入口地址存储在 ZooKeeper集群,表地实体由若干个 Regionserver进行管理(持久化在 HDFS上) 4 第5章HBase深入解析 5.1水平分区原理 Ø 5.1.1META表 Ø 查看其键值对内容: Ø scanhbase:meta’ Ø WEB界 Ø 列族info中包含三个列 :regioninfo,server与 serverstartcode 。 Ø Regioninfo中记录了行键范围,列族 列表与属性; Ø server记录了负责地Regionserver地 址; 5 第5章HBase深入解析 5.1水平分区原理 Ø 5.1.2数据写入与读取机制 Ø Regionserver负责向对应地表分区与列族中写入数据,管理缓存与排序,以及实现 容错。 Ø 分区(Region):对应表地横向拆分 Ø Store:对应(列族)纵向拆分 Ø 数据先写入内存(Memstore),根据时间,数据量,用户指令等进行flush Ø 每次flush形成一个storefile (持久化,写入HDFS) Ø Storefile中地行键是有序地,Store之间无序(但行键地范围受分区地限制) Ø 某个store触发flush,则分区内地所有store都会进行flush,无论其是否达到触发条 6 件 第5章HBase深入解析 5.1水平分区原理 Ø 5.1.2数据写入与读取机制 Ø 列族过多地影响? Ø 为什么每次flush,会生成一个 新文件? 7 第5章HBase深入解析 5.1水平分区原理 Ø 5.1.2数据写入与读取机制 Ø 手动持久化操作 Ø flushTABLENAME Ø flushREGIO AME‘ Ø REGIO AME是编码过地分区名,可以在meta表中查询。 8 第5章HBase深入解析 5.1水平分区原理 Ø 5.1

文档评论(0)

王小磊 + 关注
实名认证
文档贡献者

临床内科执业资格证持证人

该用户很懒,什么也没介绍

领域认证该用户于2023年03月29日上传了临床内科执业资格证

1亿VIP精品文档

相关文档