- 42
- 0
- 约1.39万字
- 约 58页
- 2017-03-06 发布于湖北
- 举报
大数据技术原理与应用 第十章 Spark
16.6.2启动Spark Shell Spark Shell 提供了简单的方式来学习Spark API Spark Shell可以以实时、交互的方式来分析数据 Spark Shell支持Scala和Python ? ? 启动Spark Shell成功后在输出信息的末尾可以看到“Scala ”的命令提示符,如下图所示。 图6 可通过Yarn进行资源管理的应用 本章节内容选择使用Scala进行编程实践,了解Scala有助于更好地掌握Spark。 执行如下命令启动Spark Shell: 16.6.3 Spark RDD基本操作 Spark的主要操作对象是RDD,RDD可以通过多种方式灵活创建,可通过导入外部数据源建立,或者从其他的RDD转化而来。 在Spark程序中必须创建一个SparkContext对象,该对象是Spark程序的入口,负责创建RDD、启动任务等。在启动Spark Shell后,该对象会自动创建,可以通过变量sc进行访问。 作为示例,我们选择以Spark安装目录中的“README.md”文件作为数据源新建一个RDD,代码如下: ? Spark RDD支持两种类型的操作: 动作(action):在数据集上进行运算,返回计算值 转换(transformation): 基于现有的数据集创建一个新的数据集 ? Scala val textFile = sc.te
您可能关注的文档
- 大型机电设备检查内容.doc
- 事业单位考试——word试题及答案讲述.doc
- 事业单位财政与非财政补助之账务处理讲述.doc
- 三年级语文下册《语文百花园二》作文课件.(语文S版)概要.ppt
- 三年级第二讲作文:如何积累词语-概要.ppt
- 三年级语文下册习作四《我学会了XX》课件3新人教版概要.ppt
- 三年级语文下册第6单元29《在牛肚子里旅行》课件1沪教版概要.ppt
- 三年级语文下概要.doc
- 三年级语文下册第6单元30《邻家的星期四》课件4沪教版概要.ppt
- 三年级语文下册第8单元29《清明节的由来》课件4语文S版概要.ppt
- 广州高考理科一张纸复习清单.docx
- 2026年新高考全国乙卷高考文综易错题卷含解析.docx
- 2026年新高考全国乙卷数学易错知识点卷含高频考点含解析.docx
- 2026年新课标 I 卷高考生物冲刺模拟卷(含解析).docx
- 2026年新课标 I 卷数学高频考点专项卷(含解析).docx
- 2026年新课标 II 卷高考生物押题预测卷(含解析).docx
- 2026年新课标 I 卷高考语文易错题预测卷压轴题含解析.docx
- 2026年新课标 II 卷高考数学论述类文本阅读卷含解析.docx
- 2026年新课标II卷高考化学有机合成易错题卷(含解析).docx
- 2026年新课标II卷语文预测押题卷(含解析).docx
最近下载
- 租房合同范本下载(可直接打印).docx VIP
- 2025年年医师资格实践技能考试考官培训考核试卷(乡村全科执业助理医师)925.pdf VIP
- 2026年二级建造师继续教育考试试题及详细答案解析.docx VIP
- 2024年山东潍坊中考数学试卷真题(含答案).docx VIP
- 深度解析(2026)SYT 5415-2012《钻头使用基本规则和磨损评定方法》.pptx VIP
- 机房日常巡检记录表.xlsx VIP
- 土地出让培训课件.pptx VIP
- 汽车维修管理系统研究毕业论文.pdf VIP
- ZXONE 9700产品技术规范书_20150817.docx VIP
- 《中国脑血管病影像应用指南2019》要点.docx VIP
原创力文档

文档评论(0)