- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
组件比较:
序号
组件名称
CDH
(美国
Cloudera)
HDP
(美国
Hortonworks)
MAPR
(美国
MapR)
DKH
(中国
大快)
Transwarp
(中国
星环)
1
Hadoop
√
√
√
√
√
2
HBase
√
√
√
√
3
Zookeeper
√
√
√
√
√
4
Spark
√
√
√
√
5
Hive
√
√
√
√
6
Hue
√
√
√
7
Impala
√
√
8
Sqoop
√
√
√
√
√
9
Flume
√
√
√
√
√
10
Oozie
√
√
√
√
√
11
Solr
√
√
√
12
Isilon
√
13
KV indexer
√
14
Cloudera Manager
√
15
kafka
√
√
16
Storm
√
√
√
17
Elasticsearch
√
√
18
DK-ESSQL
√
19
DK-NLP
√
20
DK-SPIDER
√
21
DKM
√
22
DK-DMYSQL
√
23
Falcon
√
24
Knox
√
25
Phoenix
√
26
Pig
√
√
27
Ranger
√
28
Slider
√
29
Tez
√
30
Drill
√
31
MapR-DB
√
32
MapR Streams
√
33
Mahout
√
√
34
HttpFS
√
35
Sentry
√
36
Sahara
√
37
Myriad
√
38
Transwarp Inceptor
√
39
Transwarp Hyperbase
√
40
Transwarp Stream
√
41
Ambari
√
组件简介:
1、Hadoop
简介:集群基础组件,分为存储(HDFS)和计算(Mapreduce)两大部分。apache社区开源。技术来源于 HYPERLINK /view/105.htm \t _blank Google的GFS和Mapreduce。
2、Hbase
简介:键-值非关系型数据库,apache社区开源。是 HYPERLINK /view/105.htm \t _blank Google的Bigtable一个 HYPERLINK /view/9664.htm \t _blank 开源的实现。
3、Zookeeper
简介:集群协调组件,已开源。是 HYPERLINK /view/105.htm \t _blank Google的Chubby一个 HYPERLINK /view/9664.htm \t _blank 开源的实现。
4、Spark
简介:内存计算框架,伯克利首先提出,现已开源。
5、Hive
简介:基于HDFS的SQL工具,facebook开发,后开源。
6、Hue
简介:图形化集群工具,cloudera开发,后开源。
7、Impala
简介:基于HDFS的SQL工具,cloudera开发,后开源。
8、Sqoop
简介:用于关系型数据库与NOSQL数据库之间的数据导入导出。Cloudera开发,已开源。
9、Flume
简介:用于数据流的导入, Cloudera开发,已开源。
10、Oozie
简介:工作流系统,用于提交、监控集群作业。Cloudera开发,已开源。
11、Solr
简介:基于Lucene的全文搜索服务器。已开源。
12、Isilon
简介:基于OneFs操作系统的存储产品,美国赛龙公司开发,后属于EMC,一种集群存储方案。
13、K-V store indexer
简介:为HBase到solr的索引中间件,为NGDATA公司开发,已开源。
14、Cloudera Manager
简介:CDH集群安装管理工具。Cloudera开发。
15、kafka
简介:消息队列组件。已经开源。
16、Storm
简介:流数据处理组件。
17、Elasticsearch
简介:基于Lucene的全文搜索服务器。已开源。
18、ESSQL
简介:基于Elasticsearch的SQL工具,大快开发。
19、DK-NLP
简介:自然语言处理组件。大快开发,已开源。
20、DK-SPIDER
简介:分布式爬虫组件。大快开发。
21、DKM
简介:集群安装管理工具。大快开发。
22、DK-DMYSQL
简介:分布式MYSQL组件,大快改写。
23、Apache Falcon
简介:Falcon 是一个面向Hadoop的、新的数据处理和管理平台,设计用于数据移动、数据管道协调、生命周期管理和数据发现。
24、Apache Knox
简介:Apache knox是一个访问hadoop集群的restapi网关,它为所有rest访问提供了一个简单的访问接口点。
25、Apache Phoenix
简介:
文档评论(0)