大数据计算系统应用笔记:Spark与Hadoop核心组件.pdfVIP

  • 0
  • 0
  • 约小于1千字
  • 约 2页
  • 2026-05-12 发布于北京
  • 举报

大数据计算系统应用笔记:Spark与Hadoop核心组件.pdf

《305_Spark分布式计算系统架构原理分析》

Hadoop

MapReduce、Spark,原生的API

map()、reduce()、flatMap()、groupByKey()、join()、reduceByKey(),

select*fromtable,SQL类似语法Hive,数据仓库,纯正的SQL语法

Mahout,给我们一些机器学习算法,使用MapReduce处理数据

SparkGraphX,SparkMLlib,图计算和机器学习开发,Spark,SparkSQL可以写一些SQLl

《305_Spark分布式计算系统架构原理分析》

hadoop

mapreduce、spark,原生的API

map()、reduce()、flatMap()、groupByKey()、join()、reduceByKey()

select*fromtable,sql-like语法

hive,数据仓库,纯正的sql语法,

Mahout,给我们一些机器学习算法,mapreduce处理数据

sparkgraphx,sparkmllib,图计算和机器学习开发,spark,sparksql,可以写一些sql

文档评论(0)

1亿VIP精品文档

相关文档