[大数据资源整理.docxVIP

  • 1
  • 0
  • 约1.78万字
  • 约 26页
  • 2017-01-09 发布于北京
  • 举报
[大数据资源整理

最全大数据学习资源整理超人学院MySQL:世界最流行的开源数据库;PostgreSQL:世界最先进的开源数据库;Oracle 数据库:对象-关系型数据库管理系统。框架Apache Hadoop:分布式处理架构,结合了 MapReduce(并行处理)、YARN(作业调度)和HDFS(分布式文件系统);Tigon:高吞吐量实时流处理框架。分布式编程AddThis Hydra :最初在AddThis上开发的分布式数据处理和存储系统;AMPLab SIMR:用在Hadoop MapReduce v1上运行Spark;Apache Beam:为统一的模型以及一套用于定义和执行数据处理工作流的特定SDK语言;Apache Crunch:一个简单的Java API,用于执行在普通的MapReduce实现时比较单调的连接、数据聚合等任务;Apache DataFu:由LinkedIn开发的针对Hadoop and 和Pig的用户定义的函数集合;Apache Flink:具有高性能的执行时间和自动程序优化;Apache Gora:内存中的数据模型和持久性框架;Apache Hama:BSP(整体同步并行)计算框架;Apache MapReduce :在集群上使用并行、分布式算法处理大数据集的编程模型;Apache Pig :Hadoop中,用于处理数据分析程序的高级查询语言;Apache REEF

文档评论(0)

1亿VIP精品文档

相关文档