网站大量收购独家精品文档,联系QQ:2885784924

分布式数据库HBase PPT课件单元7 MapReduce On HBase.pptx

分布式数据库HBase PPT课件单元7 MapReduce On HBase.pptx

  1. 1、本文档共33页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

单元7MapReduceOnHBase

17.2HBase集成MapReduce实操目录7.1HBaseMapReduce2

7.1HBaseMapReduceHBase数据是分布式存储在RegionServer上的,对于整体数据统计和分析,仅仅使用HBase过滤器是远远没办法满足实际场景的。这个时候MapReduce就发挥了重要作用。MapReduce是一种用于处理大规模数据集的编程模型和算法。MapReduce主要由四个部分组成,分别是Client、JobTracker、TaskTracker以及Task

7.1HBaseMapReduce从MapReduce应用场景来看,MapReduce是从分布式文件获取输入,然后输出到另一个文件,但是对于HBase分布式数据库来说,场景则是从表到文件、从文件到表、从表到表等多种应用场景,传统的MapReduce没办法满足这种需求,这个情况下,HBase的MapReduce就应运而生

7.2HBase集成MapReduce实操7.2.1HBase集成MapReduce步骤1:查看集成MapReduce需要的命令。/usr/local/hbase-2.4.6/bin/hbase

7.2HBase集成MapReduce实操7.2.1HBase集成MapReduce步骤2:设置环境变量,具体的设置内容如下所示。[root@masterhbase-2.4.6]#cd/usr/local/hbase-2.4.6[root@masterhbase-2.4.6]#exportHBASE_HOME=/usr/local/hbase-2.4.6[root@masterhbase-2.4.6]#exportHAD0OP_HOME=/usr/local/hadoop/[root@masterhbase-2.4.6]#HADOOP_CLASSPATH=${HBASE_HOME}/bin/hbasemapredcp

7.2HBase集成MapReduce实操7.2.1HBase集成MapReduce步骤3:启动history服务,启动HDFS和yarn等任务,如下所示。[root@masterhbase-2.4.6]#mapred--daemonstarthistoryserver步骤4:启动hbase任务,如下所示。[root@masterhbase-2.4.6]#./start-all.sh步骤5:导入相应的jar包,如下所示。[root@masterhbase-2.4.6]#hdfsdfs-puthbase-client-1.1.5.jar/hbase/lib[root@masterhbase-2.4.6]#hdfsdfs-puthbase-hadoop-compat-1.1.5.jar/hbase/lib[root@masterhbase-2.4.6]#hdfsdfs-puthbase-server-1.1.5.jar/hbase/lib

7.2HBase集成MapReduce实操7.2.1HBase集成MapReduce步骤6:查看HBase自带的MapReduce的RowCounter计算fruit表的行数。这里采用fruit表,其中表中内容如图7-4所示。hbase:001:0scanfruit通过比较hbaseshell和MapReduce计算结果,两者计算结果一致。MapReduce的RowCounter计算fruit表的行数代码如下:$HBASE_HOME/bin/hbaseorg.apache.hadoop.hbase.mapreduce.RowCounterfruit

7.2HBase集成MapReduce实操7.2.1HBase集成MapReduce步骤7:Export也是MapReduce中的自带用法,这里通过Export导出HBbase表到HDFS文件中。测试Export将fruit表导出到HDFS中/hbase/fruit,代码如下。$HBASE_HOME/bin/hbaseorg.apache.hadoop.hbase.mapreduce.Exportfruit/hbase/fruit执行完成后在HDFS查看导出的文件,执行代码如下。hdfsdfs-ls/hbase/fruit

7.2HBase集成MapReduce实操7.2.1HBase集成MapReduce步骤8:Import的用法和Export类似,实现HDFS文件导入到HBase表,测试Import将HDFS中/hbase/fruit导入HBase表,具

文档评论(0)

allen734901 + 关注
实名认证
内容提供者

副教授持证人

知识共享

领域认证该用户于2024年11月14日上传了副教授

1亿VIP精品文档

相关文档