- 1
- 0
- 约7.96千字
- 约 36页
- 2017-07-08 发布于贵州
- 举报
SPARK 大据处理引擎(初级)
粗粒度、细粒度是个什么东西 ? 01:8080 参考: /cn/news/2014/08/spark-hardware-configure 千万不要让集群节点的磁盘容量差异太大,否则在大数据写入并且集群使用率较大时,容易出现写失败等问题。 模板来自于 * 云软件组 陈修恒 SPARK 大数据处理引擎 Spark 一、Apache Spark 项目 三、Spark 技术架构 四、Spark 核心技术 五、部署方式 六、运行流程 七、配置要求 Hadoop生态系统 Ambari (安装、部署、配置和管理工具) Hive (数据仓库) Pig (数据流处理) Mahout (数据挖掘库) MapReduce (分布式计算框架) HDFS (分布式文件系统) Apache Hadoop 项目 Common HDFS 一个部署在廉价的机器上、具有高度容错性的文件系统 YARN 资源调度引擎 MapReduce 基于YARN调度引擎的大数据并行处理系统 A YARN-based system for parallel processing of large data sets. Apach Spark 项目 Spark是一个快速通用的大规模数据处理框架。具有Hadoop的批处理能力,而且性能更佳。可以用于流处理、Sql统计、机器学习和图计算。 Apach Spa
您可能关注的文档
最近下载
- 《建筑幕墙高空作业施工安全保障技术规范》.pdf VIP
- 给排水国标图集-02S404:防水套管.pdf VIP
- CN1958558A 盐酸(或草酸)L—麻黄碱异构化为盐酸d—伪麻黄碱的方法 (新疆大学).docx VIP
- 约克约克 高效水冷螺杆冷水机组 YGWE YEWS-E YEWS-C YEWS-D 说明书用户手册.pdf
- 控告申诉业务竞赛含答案.docx VIP
- 二年级语文上册期末复习:形容词归纳+练习题.pdf VIP
- CN112939793B 麻黄碱和伪麻黄碱工业生产过程中母液中活性成分的回收利用方法 (浙江普洛康裕制药有限公司).docx VIP
- 中国地质大学(北京)《智能仪器仪表设计基础》2022-2023学年第一学期期末试卷.doc VIP
- 资料文稿easyvision操作说明.pdf VIP
- 控告申诉 笔试试卷.docx VIP
原创力文档

文档评论(0)