- 6
- 0
- 约7.96千字
- 约 36页
- 2017-05-21 发布于四川
- 举报
粗粒度、细粒度是个什么东西 ? 01:8080 参考: /cn/news/2014/08/spark-hardware-configure 千万不要让集群节点的磁盘容量差异太大,否则在大数据写入并且集群使用率较大时,容易出现写失败等问题。 模板来自于 * 云软件组 陈修恒 SPARK 大数据处理引擎 Spark 一、Apache Spark 项目 三、Spark 技术架构 四、Spark 核心技术 五、部署方式 六、运行流程 七、配置要求 Hadoop生态系统 Ambari (安装、部署、配置和管理工具) Hive (数据仓库) Pig (数据流处理) Mahout (数据挖掘库) MapReduce (分布式计算框架) HDFS (分布式文件系统) Apache Hadoop 项目 Common HDFS 一个部署在廉价的机器上、具有高度容错性的文件系统 YARN 资源调度引擎 MapReduce 基于YARN调度引擎的大数据并行处理系统 A YARN-based system for parallel processing of large data sets. Apach Spark 项目 Spark是一个快速通用的大规模数据处理框架。具有Hadoop的批处理能力,而且性能更佳。可以用于流处理、Sql统计、机器学习和图计算。 Apach Spa
您可能关注的文档
- PCI数据加密技术与应用.ppt
- PDCA持续改进的作业方法.ppt
- PDS——交车前检验.ppt
- PEP五年级下Unit1第二课时.ppt
- PEP人教版小学三年级英语下册Unit3Howmany课件PPT.ppt
- PEP小学英语四年级unit3readandwrite说课课件课件.ppt
- period12Book8BUnits7-8中考英语教材知识点梳理以及重点句型讲解.ppt
- period2Book7AUnits7-12中考英语教材知识点梳理以及重点句型讲解.ppt
- period8Book8AUnits10-12中考英语教材知识点梳理以及重点句型讲解.ppt
- peter教师述职报告.ppt
- 明志和安防科技有限公司晋中分公司防火材料建设项目环评资料环境影响报告.docx
- 年产 15 万立方蒸压加气混凝土板和年产 20 万立方蒸压加气混凝土砌块生产线项目环评资料环境影响报告.docx
- 蠡湖未来城湖城共荣绿色产业融合发展EOD项目-蠡湖水环境深度治理生态保护与修复工程环评资料环境影响报告.docx
- 傀儡湖水源保护与生态提升工程项目环评资料环境影响报告.docx
- 金属有机框架衍生纳米纤维活化过硫酸盐降解水中抗生素.pdf
- 梯形笼的制备及其对阴离子识别行为的调控.pdf
- 初中地理教学中的问题链设计研究.pdf
- 华夏人文始祖崇拜对凝聚中华民族共同体意识的促进作用--以女娲伏羲信仰为例.pdf
- 高中语文古代论说文思辨性阅读教学研究.pdf
- 协同治理视域下L县危化品安全生产监管研究.pdf
原创力文档

文档评论(0)