大数据技术与应用基础第6、7章分布式数据库HBase、数据仓库工具Hive.pptxVIP

大数据技术与应用基础第6、7章分布式数据库HBase、数据仓库工具Hive.pptx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
能力要求CAPACITY了解HBase包含3个重要组件。熟悉HBase的基本应用。掌握HBase的特点。HBase简介HBase接口安装HBase集群HBase ShellHBase APIHBase综合实例一、HBase简介HBase(Hadoop Database)是一个开源的、面向列(Column-Oriented)、适合存储海量非结构化数据或半结构化数据的、具备高可靠性、高性能、可灵活扩展伸缩的、支持实时数据读写的分布式存储系统。HBase包含3个重要组件:ZooKeeper、HMaster和HRegionServer。ZooKeeper为整个HBase集群提供协助的服务(信息传输),HMaster主要用于监控和操作集群中的所有RegionServer,HRegionServer主要用于服务和管理分区(regions)。Hbase简介Hbase接口安装HBase集群HBase ShellHBase APIHBase综合实例二、Hbase接口HBase集群访问可以有多种方式,不同方式的使用场景不同,HBase的访问接口如下:1. Native Java API2. HBase Shell HBase Shell是HBase的命令行工具,是最简单的接口,适合HBase管理使用。3. Thrift Gateway4. REST Gateway5. PIG 可以使用Pig Latin流式编程语言来操作HBase中的数据,其本质是编译成MapReduce Job来处理HBase表数据,适合做数据统计。6. HiveHive 0.7版本中添加了HBase的支持,可以使用类似SQL的语言HQL来访问HBase,其本质类似Pig,把脚本编译成MapReduce Job来处理HBase表数据。HBase简介HBase接口安装HBase集群HBase ShellHBase APIHBase综合实例三、安装Hbase集群系统环境:? Hadoop 2.6.0 分布式系统基础架构? Java jdk 1.7 一种面向对象的编程语言 ? ZooKeeper 3.4.6 分布式应用程序协调服务? Hbase 0.98.21 分布式、面向列的开源数据库? Ubuntu 14.04 一种Linux操作系统安装ZooKeeper:在主节点上下载安装ZooKeeper。hadoop@master:~$wget /apache/hbase/hbase-1.0.3/hbase-1.0.3-bin.tar.gz将conf目录下面的zoo_sample.cfg修改为zoo.cfg。修改zoo.cfg,添加一条参数dataDir=/hadoop/zookeeper/data在dataDir指定的数据目录(/hadoop/zookeeper/data)下,创建文件myid,文件内容为一个正整数值,用来唯一表示当前机器,因此不同机器的数值不能相同,可以选择0、1、2。三、安装Hbase集群在zoo.cfg中加入如下参数,如图6-3所示。-server.0=master:2888:3888 注释:0为master节点的myid-server.1=slave1:2888:3888 注释:1为slave1节点的myid-server.2=slave2:2888:3888 注释:2为slave2节点的myid将主节点的ZooKeeper安装目录分发到两个从节点slave1,slave2上。将$ZOOKEEPER_HOME/bin添加到Linux用户的环境变量文件.bashrc中。在各个节点上通过zkServer.sh start命令启动ZooKeeper服务,命令如下zkServer.sh start //启动ZooKeeper服务zkServer.sh status //查看节点ZooKeeper服务状态,服务状态分为leader,follower三、安装Hbase集群安装Hbase:在主节点上通过下面命令下载Hbase到Linux用户的家目录中。wget /apache/hbase/0.98.21/hbase-0.98.21-hadoop2-bin.tar.gz修改HBase根目录下conf文件夹中hbase-site.xml文件如下:configurationproperty namehbase.rootdir/name valuehdfs://master:9000/hbase/value/propertyproperty namehbase.zookeeper.quorum/name valuemaster,slave1,slave2/value/propertyproperty namehbase.cluster.distributed/name value

文档评论(0)

132****9295 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档