Chapter4-厦门大学-林子雨-大数据技术原理和应用-第四章-分布式数据库HBase.ppt

Chapter4-厦门大学-林子雨-大数据技术原理和应用-第四章-分布式数据库HBase.ppt

  1. 1、本文档共41页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
4.6.1 HBase常用Shell命令 create:创建表 list:列出HBase中所有的表信息 4.6.1 HBase常用Shell命令 put:向表、行、列指定的单元格添加数据 scan:浏览表的相关信息 4.6.1 HBase常用Shell命令 get:通过表名、行、列、时间戳、时间范围和版本号来获得相应单元格的值 4.6.1 HBase常用Shell命令 enable/disable:使表有效或无效 drop:删除表 4.6.2 HBase常用Java API及应用实例 Hbase常用Java API (1)org.apache.hadoop.hbase.client.HBaseAdmin 该类用于管理HBase数据库的表信息,包括创建或删除表、列出表项、使表有效或无效、添加或删除表的列族成员、检查HBase的运行状态等 ? (2)org.apache.hadoop.hbase.HBaseConfiguration 该类用于管理HBase的配置信息 ? (3)org.apache.hadoop.hbase.client.HTable 用于与HBase进行通信。如果多个线程对一个HTable对象进行put或者delete操作的话,则写缓冲器可能会崩溃 4.6.2 HBase常用Java API及应用实例 (4)org.apache.hadoop.hbase.HTableDescriptor HTableDescriptor包含了HBase中表格的详细信息,例如表中的列族、该表的类型(-ROOT-,.META.)、该表是否只读、MemStore的最大空间、Region什么时候应该分裂等等 (5)org.apache.hadoop.hbase.HColumnDescriptor HColumnDescriptor包含了列族的详细信息,例如列族的版本号、压缩设置等。HColumnDescriptor通常在添加列族或者创建表的时候使用。列族一旦建立就不能被修改,只能通过删除列族,然后再创建新的列族来间接的修改列族。一旦列族被删除了,该列族包含的数据也随之被删除 4.6.2 HBase常用Java API及应用实例 (6)org.apache.hadoop.hbase.client.Put 用来对单元格执行添加数据操作 (7)org.apache.hadoop.hbase.client.Get 用来获取单行的信息 (8)org.apache.hadoop.hbase.client.Result 用于存放Get或Scan操作后的查询结果,并以key,value的格式存储在map结构中。该类不是线程安全的 (9)Org.apache.hadoop.hbase.client.ResultScanner 客户端获取值的接口 ? 本章小结 本章详细介绍了HBase数据库的知识。HBase数据库是BigTable的开源实现,和BigTable一样,支持大规模海量数据,分布式并发数据处理效率极高,易于扩展且支持动态伸缩,适用于廉价设备 HBase可以支持Native Java API、HBase Shell、Thrift Gateway、REST Gateway、Pig、Hive等多种访问接口,可以根据具体应用场合选择相应访问方式 HBase实际上就是一个稀疏、多维、持久化存储的映射表,它采用行键、列键和时间戳进行索引,每个值都是未经解释的字符串。本章介绍了HBase数据在概念视图和物理视图中的差别 HBase采用分区存储,一个大的表会被分拆许多个Region,这些Region会被分发到不同的服务器上实现分布式存储 HBase的系统架构包括客户端、Zookeeper服务器、Master主服务器、Region服务器。客户端包含访问HBase的接口;Zookeeper服务器负责提供稳定可靠的协同服务;Master主服务器主要负责表和Region的管理工作;Region服务器负责维护分配给自己的Region,并响应用户的读写请求 本章最后详细介绍了HBase运行机制和编程实践的知识 主讲教师和助教 单位:厦门大学计算机科学系 E-mail: ziyulin@ 个人网页:/linziyu 数据库实验室网站: 主讲教师:林子雨 单位:厦门大学计算机科学系数据库实验室2013级硕士研究生(导师:林子雨) E-mail: caiminxing@126.com 助教:蔡珉星 欢迎访问《大数据技术原理与应用——概念、存储、处理、分析与应用》 教材官方网站:/post/bigdata Department of Computer Science, Xiamen University, June, 2015 * 图片展示的实例: (1)利

文档评论(0)

xiaofei2001128 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档