两张特殊表:ROOT AMP; .META. GOOGLECODE.docx

两张特殊表:ROOT AMP; .META. GOOGLECODE.docx

  1. 1、本文档共8页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
两张特殊表:ROOT AMP; .META. GOOGLECODE

HBase 系统架构HBase是Apache Hadoop的数据库,能够对大型数据提供随机、实时的读写访问。HBase的目标是存储并处理大型的数据。HBase是一个开源的,分布式的,多版本的,面向列的存储模型。它存储的是松散型数据。HBase特性:1 高可靠性2 高效性3 面向列4 可伸缩5 可在廉价PC Server搭建大规模结构化存储集群HBase是Google BigTable的开源实现,其相互对应如下: Google   HBase文件存储系统 ?GFS  ?HDFS海量数据处理 ?MapReduce Hadoop  MapReduce协同服务管理 Chubby  ZookeeperHBase关系图:HBase位于结构化存储层,围绕HBase,各部件对HBase的支持情况:Hadoop部件 作用HDFS 高可靠的底层存储支持MapReduce   高性能的计算能力Zookeeper  稳定服务和failover机制PigHive ?高层语言支持,便于数据统计Sqoop ?提供RDBMS数据导入,便于传统数据库向HBase迁移访问HBase的接口方式 特点 场合Native Java API 最常规和高效   Hadoop MapReduce Job并行处理HBase表数据HBase Shell ?最简单接口  ?HBase管理使用Thrift Gateway 利用Thrift序列化支持多种语言    ?异构系统在线访问HBase表数据Rest Gateway ?解除语言限制   Rest风格Http API访问Pig Pig Latin六十编程语言处理数据   数据统计Hive ?简单,SqlLikeHBase 数据模型组成部件说明:Row Key:     Table主键 行键 Table中记录按照Row Key排序Timestamp:? ?  每次对数据操作对应的时间戳,也即数据的version numberColumn Family:  列簇,一个table在水平方向有一个或者多个列簇,列簇可由任意多个Column组成,列簇支持动态扩展,无须预定义数量及类型,二进制存储,用户需自行进行类型转换TableRegion1. Table随着记录增多不断变大,会自动分裂成多份Splits,成为Regions2. 一个region由[startkey,endkey)表示3. 不同region会被Master分配给相应的RegionServer进行管理两张特殊表:-ROOT- .META..META.   记录用户表的Region信息,同时,.META.也可以有多个region-ROOT-  ? 记录.META.表的Region信息,但是,-ROOT-只有一个regionZookeeper中记录了-ROOT-表的location客户端访问数据的流程:Client - Zookeeper - -ROOT- - .META. - 用户数据表多次网络操作,不过client端有cache缓存HBase 系统架构图组成部件说明Client:使用HBase RPC机制与HMaster和HRegionServer进行通信Client与HMaster进行通信进行管理类操作Client与HRegionServer进行数据读写类操作Zookeeper:Zookeeper Quorum存储-ROOT-表地址、HMaster地址HRegionServer把自己以Ephedral方式注册到Zookeeper中,HMaster随时感知各个HRegionServer的健康状况Zookeeper避免HMaster单点问题HMaster:HMaster没有单点问题,HBase中可以启动多个HMaster,通过Zookeeper的Master Election机制保证总有一个Master在运行主要负责Table和Region的管理工作:1 管理用户对表的增删改查操作2 管理HRegionServer的负载均衡,调整Region分布3 Region Split后,负责新Region的分布4 在HRegionServer停机后,负责失效HRegionServer上Region迁移HRegionServer:HBase中最核心的模块,主要负责响应用户I/O请求,向HDFS文件系统中读写数据HRegionServer管理一些列HRegion对象;每个HRegion对应Table中一个Region,HRegion由多个HStore组成;每个HStore对应Table中一个Column Family的存储;Column Family就是一个集中的存储单元,故将具有相同IO特性的Column放在一个Column Family会更高效HStore:HBase存储的核心。由M

您可能关注的文档

文档评论(0)

almm118 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档