- 1、本文档共4页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
图标
组件名称
说明
Falcon
一个数据生命周期管理框架
Solr
搜索工具
Hive
数据仓库
Hbase
基于key-value的列式存储数据库
TensorFlow
开源机器学习工具
Ambari
Hadoop集群管理运维工具
Drill
数据查询引擎
Spark
实时计算工具
Flume
数据采集工具
Sqoop
数据ETL工具
ElasticSearch
搜索系统
Logstash
日志采集工具
Kibana
数据展现工具
Ranger
集中安全管理工具
Atlas
数据治理和元数据管理框架
kettle
ETL工具
mongodb
Key-value数据库
saiku
数据分析工具
Kerberos
Kylin
一个基于预计算的数据分析引擎
Zeppelin
数据分析展示工具
Flink
实时计算框架
Mahout
数据挖掘工具
Kafka
基于消息订阅的高速数据总线
Druid
多维数据分析工具
Pig
一个编程工具
Storm
实时计算工具
Oozie
工作流管理
Tez
应用处理框架
Zookeeper
分布式高可用工具
sentry
授权管理工具
HUE
Hue is a smart Analytics Workbench.
dremio
另外一个drill
Nifi
一个易用,强大,可靠的数据处理分发工具
Presto
分布式大数据SQL查询引擎
Cassandra
?一个面向列式存储的数据库
Greenplum Database
旗舰分析数据仓库
Superset
可视化分析工具
Livy
REST Service for spark
HAWQ
Hadoop With Query (是一个Hadoop原生大规模并行SQL分析引擎,针对的是分析性应用)
Chukwa
Apache Chukwa is an open source data collection system for monitoring large distributed systems.
Kudu
Kudu is a columnar storage manager developed for the Apache Hadoop platform
Tajo
A big data warehouse system on Hadoop
Trafodion
Transactional SQL-on-Hadoop Database
Phoenix
OLTP and operational analytics for Apache Hadoop
Impala
Apache Impala (incubating) is the open source, native analytic database
for Apache Hadoop
Giraph
Apache Giraph is an iterative graph processing system built for high scalability.
Hama
Apache HamaTM is a framework for Big Data analytics which uses the Bulk Synchronous Parallel (BSP) computing model
Slider
Dynamic YARN Applications
Avro
Apache Avro? is a data serialization system.
Aurora
Aurora is a Mesos framework for?long-running services and cron jobs.
Eagle
Analyze Big Data Platforms For Security and Performance
Ignite
A memory-centric data platform
Twill
Apache Twill is an abstraction over Apache Hadoop? YARN that reduces the complexity of developing distributed applications, allowing developers to focus instead on their application logic.
Accumulo
Apache Accumulo? is a sorted, distributed key/value store that provides robust, scalable data storage and retrieval.
Gora
The Apache Gora open sou
文档评论(0)