第8章 列式存储数据库HBase.pptxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

第8章列式存储数据库HBase

·HBase的概述

·HBase的数据模型·HBase的架构

·HBase的部署

·HBase的基本操作

HBase的数据模型

HBase的概述

HBase的部署

目录

HBase的基本操作

☞点击查看本节相关知识点

HBase的部署

目录

8.5HBase的基本操作

知识架构

章节概要

列式存储数据库也是NoSQL数据库的一种类型。顾名思义,列式存储数据库中的数据是基于列进行存储的。常见的列式存储数据库有HBase、Cassandra、Riak以及HyperTable。由于HBase数据库基于

Hadoop生态系统,利用HBase集群可在多台廉价PCServer上实现结构化数据的分布式数据存储,从而处理海量的数据。

本章将针对HBase数据库的相关知识进行详细讲解。

HBase起源于2006年Google发表的BigTable论文。

在2008年,PowerSet的ChadWalters和JimKeller受到

了该论文思想的启发,从而把HBase作为Hadoop的子项

目来进行开发维护,运行于HDFS文件系统之上,主要用于支持结构化的海量数据存储。

HBase是一个基于Java、开源的、高可靠性、高性

能、面向列、可伸缩的列式非关系型数据库,也可以称为列式分布式数据库(简称HBase分布式数据库)。HBase

的目标是存储并处理海量非结构化和半结构化的松散数

据,更具体来说是仅需使用普通的硬件配置,就能够处理由成千上万的行和列所组成的海量数据。

8.1HBase的概述

多版本

HBase

8.1HBase的概述

特点

稀疏性

8.1HBase的概述

HBase作为一种数据库,它与传统数据库相比有很大区别,下面从存储模式、表字段以及可延伸性这三个方面分别进行介绍。

8.1HBase的概述

HBase的常见应用场景

单存储

CubeDB

OLAP

8.2HBase的数据模型

HBase分布式数据库的数据存储在行列式的表格中,它是一个多维度的映射模型,其数据模型如图所示。

8.2HBase的数据模型

8.2HBase的数据模型

8.3HBase的架构

HBase构建在Hadoop分布式文件系统(HDFS)之上,HDFS为HBase提

供了高可靠的底层存储支持,Hadoop分布式计算框架(MapReduce)为

HBase提供了高性能的计算能力,分布式协作框架(Zookeeper)为HBase提供

了稳定服务和容错机制。下面,通过一张图介绍一下HBase的整体架构,具体如

图所示。

8.3HBase的架构

8.3HBase的架构

8.3HBase的架构

8.3HBase的部署

HBase中存储在HDFS中的数据是通过Zookeeper协调处理的。由于HBase

存在单点故障的问题,因此,可以通过Zookeeper部署一个高可用的HBase集群解决。下面,以三台服务器为例(nosql01、nosql02和nosql03),讲解如何安装部署HBase高可用集群。HBase高可用集群的规划方式如图所示。

HBase高可用集群中的nosql01和nosql02是主节点,nosql02和nosql03是

从节点。这里之所以将nosql02既部署为主节点也部署为从节点,其目的是为了避免HBase集群主节点宕机导致单点故障问题。

8.3HBase的部署

接下来,分步骤讲解如何部署HBase集群,具体步骤如下:

(1)安装JDK、Hadoop以及Zookeeper,这里我们设置的JDK

版本是1.8、Hadoop版本是2.7.4以及Zookeeper的版本是3.4.10,关于JDK、Hadoop以及Zookeeper的安装部署,请参考第8章环境配置

文档,该文档我们将以资源文档的形式提供给读者。

(2)下载HBase安装包。官网下载地址:

/dist/hbase/。

注:本书会提供和使用hbase-1.2.1-bin.tar.gz安装包。

8.3HBase的部署

(3)通过SecureCRT工具将HBase安装包上传到服务器nosql01的/opt/software/目录下,并修改安装包的用户和用户组权限为

user_hbase,然后解压HBase安装包至/opt/servers/hbase_demo目录下。解压安装包的具体命令如下:

(4)将/hadoop-2.7.4/etc/hadoop目录下的hdfs-site.xml和

core-site.xml配置文件复制一份到/hbase-1.2.1/conf目录下,复制文件的具体命令如下:

$tar

文档评论(0)

yangzhuangju + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档