- 0
- 0
- 约7.12千字
- 约 10页
- 2026-02-05 发布于北京
- 举报
Sparkfile,hdfs等数据源转换成RDD操作
【实验目的】
1)熟悉sparkfile,hdfs等数据源转换成RDD操作
【实验原理】
Sparkfile,hdfs等数据源转换成RDD操作,通过textFile()方法本地File,Hdfs上
的文件转换成RDD进行操作。
【实验环境】
本次环境是:6.5+eclipse
【实验步骤】
一、项目创建
1.1打开桌面eclipse。选择File‑new‑ScalaProject,弹出框,填写Project
name为simple,创建名为simple的项目。如图1所示
1.2选择项目右击选择新建‑‑Scala对象分别填写包与名称的值。如图2所示
Sparkfile,hdfs等数据源转换成RDD操作
【实验目的】
1)熟悉sparkfile,hdfs等数据源转换成RDD操作
【实验原理】
Sparkfile,hdfs等数据源转换成RDD操作,通过textFile()方法本地File,Hdfs上
的文件转换成RDD进行操作。
【实验环境】
本次环境是:6.5+eclipse
【实验步骤】
一、项目创建
1.1打开桌面eclipse。选择File-new-ScalaProject,弹出框,填写Projectname
为simple,创建名为simple的项目。如图1所示
1.2选择项目右击选择New--ScalaObject分别填写package与Name的值。如图2所示
1.3项目右击选择BuildPath‑‑ConfigureBuildPath‑‑Libraries‑‑AddExternalJARS‑‑FileSystem‑‑
simple‑‑spark‑1.6.1‑bin‑hadoop2.4‑‑lib下选择spark的所有jar包,点击OK。如图3‑4所示
1.4右击项目名称选择属性,修改Scala安装的版本。如图5所示
1.3项目右击选择BuildPath--ConfigureureBuildPath--Libraries--AddExternalJARS-
-FileSystem--simple--spark-1.6.1-bin-hadoop2.4--lib下选择spark的所有jar包,点击O
K。如图3-4所示
1.4右击项目名选择Properties,修改ScalaInstallation的版本。如图5所示
二程编
、序写
2.1eaataTest”,
编辑上面创建的对象“RdD然后编辑内容如下
pakgecom.simpleimportorg.apache.spark.SparkConfimport
ca
org.apache.spark.SparkContextimportorg.apache.spark.rdd.RDDimport
_
org.apache.spark.sql.SQLContextimportor
您可能关注的文档
- 200W LED电源供应器特性与应用概述.pdf
- 初三化学:物质构成与元素基础.pdf
- 宫颈癌及癌前病变处理与流行病学分析.pdf
- 教育培训机构通用教学课件模板.pdf
- B22 M0阶段后备门下垂强度分析报告.pdf
- 期末专题平行线综合问题三.pdf
- 休闲吧员工晋级试题卷含答案.pdf
- 电缆端部处理及焊接工艺说明.pdf
- 初级基础儿童体适能课程-动作发展与体能训练.pdf
- 高中数学题库:高三二轮复习导数专题.pdf
- 商业航天的融资渠道与风险研究_2026年1月.docx
- 智慧路灯与城市安防联动布控策略研究_2026年1月.docx
- 元宇宙实验室在工科教学中的沉浸效果评估_2026年1月.docx
- 某公司获国际海底管理局许可采矿但环保组织抗议破坏未知生态系统_2026年1月.docx
- 2026年及未来5年市场数据中国网约车行业发展前景预测及投资战略研究报告.docx
- 2026年及未来5年市场数据中国网络零售产业竞争现状及十五五投资动向研究报告.docx
- 2026年及未来5年市场数据中国卫星通信设备行业市场需求与投资战略规划分析报告.docx
- 2026年及未来5年市场数据中国卫星导航市场竞争力分析及投资战略预测研发报告.docx
- 2026年及未来5年市场数据中国网络教育行业前景研究与投资战略研究报告.docx
- 2026年及未来5年市场数据中国微型滤波器行业市场专项调研及投资前景可行性预测报告.docx
原创力文档

文档评论(0)