- 0
- 0
- 约3.26千字
- 约 25页
- 2026-06-03 发布于北京
- 举报
技术创新,变革未来SparkCore技术平台详解
内容SparkRDDSparkOperationRDD容错与持久化Spark优化Spark例子
SparkRDDResilientDistributedDataset(RDD):分布式数据集(分布在集群、已分区的)存储在内存或磁盘上只读的,不可变自动重建(容错)有两类操作transformationsactions
SparkTransformationsandActionstransformations通过其他RDD构建新的RDDmap,filter,joinlazyoperationactions返回计算结果或者保存到文件系统count,collect,savetriggersexecution
SparkTransformationsandActions
SparkRDDTransformations
SparkRDDTransformations
SparkRDDActions
SparkPairRDDTransformations
SparkPairRDDTransformations
SparkRDDLineagevalinputRDD=sc.textFile(log.txt)valerrorsRDD=inputRDD.filter(lin
您可能关注的文档
最近下载
- ISO10012-2026《质量管理——测量管理体系要求》之7-6:“7支持-7.2能力”专业深度解读和应用操作指导材料(编制-2026A0).docx VIP
- 19.《ISO10012-2026质量管理——测量管理体系要求》程序文件之19:MMS8.2测量过程要求管理程序(雷泽佳编制-2026A0).pdf VIP
- 拼购专卖店授权书模板.docx VIP
- ISO10012-2026《质量管理——测量管理体系要求》之4:“4.4测量管理体系”专业指导问答材料(雷泽佳编制-2026A0).pdf VIP
- 健康管理平均支出与生活质量.docx VIP
- 汽车发动机构造与维修.ppt VIP
- ISO10012-2026《质量管理——测量管理体系要求》之3:“4.3确定测量管理体系的范围”专业指导问答材料(雷泽佳编制-2026A0).pdf VIP
- ISO10012-2026《质量管理——测量管理体系要求》之31:“8.7不合格输出的控制”专业指导问答材料(雷泽佳编制-2026A0).pdf VIP
- ISO10012-2026《质量管理——测量管理体系要求》之35:“9.2内部审核”专业指导问答材料(雷泽佳编制-2026A0).pdf VIP
- JTG/T 3610-2019公路路基施工技术规范.pdf VIP
原创力文档

文档评论(0)