课时5 hbase与比较关系.pdfVIP

下载本文档

1
0
约2.14千字
约 3页
2025-07-06 发布于北京
举报
版权申诉

课时5 hbase与比较关系.pdf

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

5Hbase与Hive的比较关系

Pig、HBase、Hive比较关系

Pig

Pig是一种数据流语言，用来快速轻松的处理巨大的数据。Pig包含两个部分：PigInterfa

ce,PigLatin。Pig可以非常方便的处理HDFS和HBase的数据，和Hive一样,Pig可以非

常高效的处理其需要做的，通过直接操作Pig查询可以节省大量的和时间。

当你想在你的数据上做一些转换，并且不想编写MapReducejobs就可以用Pig.

Hive

于,Hive在Hadoop中扮演数据仓库的角色。建立在Hadoop集群的最顶

层，对在Hadoop群上的数据提供类SQL的接口进行操作。你可以用HiveQL进行s

elect,join,等等操作。

如果你有数据仓库的需求并且你擅长写SQL并且不想写MapReducejobs就可以用Hive

代替。

HBase

HBase作为面向列的数据库运行在HDFS之上，HDFS缺乏随即读写操作，HBase正是为

此而出现。HBase以BigTable为蓝本，以键值对的形式。项目的目标就是

快速在主机内数十亿行数据中定位所需的数据并它。

HBase是一个数据库，一个NoSql的数据库，像其他数据库一样提供随即读写功能，Ha

doop不能满足实时需要，HBase正可以满足。如果你需要实时一些数据，就把它存

入HBase。

你可以用Hadoop作为静态数据仓库，HBase作为数据，放那些进行一些操作会改

变的数据。

PigVSHive

Hive更适合于数据仓库的任务，Hive主要用于静态的结构以及需要经常分析的工作。Hiv

e与SQL相似促使其成为Hadoop与其他BI工具结合的理想交集。

Pig赋予开发人员在大数据集领域的灵活性，并允许开发简洁的用于转换数据流

以便嵌入到较大的应用程序。

Pig相比Hive相对轻量，它主要的优势是相比于直接使用HadoopJavaAPIs可大幅削减

代码量。正因为如此，Pig仍然是吸引大量的软件开发人员。

Hive和Pig都可以与HBase组合使用，Hive和Pig还为HBase提供了语言支持，

使得在HBase上进行数据统计处理变的非常简单

HiveVSHBase

Hive是建立在Hadoop之上为了减少MapReducejobs编写工作的批处理系统，HBase

是为了支持弥补Hadoop对实时操作的的项目。

想象你在操作RMDB数据库，如果是全表扫描，就用Hive+Hadoop,如果是索引

您可能关注的文档

文档评论（0）

158****9376 + 关注: 实名认证

文档贡献者

该用户很懒，什么也没介绍

咨询Ta 进入空间

1亿VIP精品文档

更多 >

课时5 hbase与比较关系.pdfVIP