- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于IDEA使用Spark API开发Spark程序.doc
基于IDEA使用Spark API开发Spark程序
清明假期折腾了两天,总结了两种方式使用IDE进行spark程序,记录一下:
第一种方法比较简单,两种方式都是采用SBT进行编译的。
注意:本地不需要安装Scala程序,否则在编译程序时有版本兼容性问题。
一、基于Non-SBT方式
创建一个Scala IDEA工程
我们使用Non-SBT的方式,点击“Next”
命名工程,其他按照默认
点击“Finish”完成工程的创建
修改项目的属性
首先修改Modules选项
在src下创建两个文件夹,并把其属性改为source
下面修改Libraries
将Spark开发需要的jar包导进来
加入后:
导入包完成后,在工程的scala下面创建一个package
创建一个Object对象
构建Spark Driver代码
该程序是对搜狗日志的处理代码
接下来进行打包,使用Project Structure的Artifacts
使用From modules with dependencies
选择Main Class
点击“OK”
把名称改为FirstSparkAppJar
因为每台机器上都安装了Scala和Spark,所以可以把Scala和Spark相关的jar文件都删掉
接下来进行Build
选择“Build Artifacts”
第一次选择Build,以后同一个工程要选择Rebuild,然后等待编译完成
下面使用spark-submit运行程序
最后任务运行完成
二、基于SBT方式
开发工具下载
Spark开发需要以下开发编译工具:
1、Scala IDE:本文以IntelliJ IDEA为例进行开发,下载地址:
/idea/download/
2、SBT(Simple Build Tool)编译工具下载:
/download.html
下载安装后,在DOS下执行sbt命令下载其所需要的jar包:
默认jar包(.idea-build、.ivy2、.sbt)下载到C盘用户目录下
(注意:使用命令sbt进行下载时要确保网速,最好使用代理下载)
开发工具配置
1、IntelliJ IDEA开发配置:
(1) 下载Scala插件:选择Configure下的Plugins进入下图
选择Install JetBrains plugin,搜索Scala进行下载。
(2) 创建基于SBT的Scala工程:
(3) 设置工程名称以及Scala和SBT版本:
注意:
最好将Download两个选项取消,否则会覆盖之前用户目录下的SBTjar包,造成编译不通过等错误
SBT和Scala的版本号在C盘用户目录下可以看出:
C:\Users\用户\.sbt\boot\scala-2.10.4\org.scala-sbt\sbt\0.13.8
这里可以一次性设置正确,也可以后续修改配置文件(build.sbt修改scala版本,perties修改sbt版本)进行修改同步。
工程路径不要使用中文,否则即使编译成功打成jar包也无法执行。
(4) 基于SBT的Scala程序对工程的结构要求比较苛刻,需要建立如下目录结构:
(5) 添加Spark插件:
注意:同时该插件需要添加到lib目录下(操作系统复制即可)
准备工作完成,下面进行Spark程序开发
编写代码
下面以类wordcount程序为例:
编写Spark程序:
请不要使用InteiiJ IDEA进行编译(汉字导致后面编译不过去)
编译和执行
(1)使用SBT进行编译和打包:
DOS下进入工程目录下,使用sbt命令进行编译和打包:
默认打的jar在工程目录test\target\scala-2.10下
(2)将jar包上传到服务器执行:
使用命令:
spark-submit --class test--master yarn test_2.10-0.1-SNAPSHOT.jar 100
更多的参数详见官方文档
有兴趣朋友可以了解更多java教程 /java/video.shtml
您可能关注的文档
- 我国色釉料产业现状及发展趋势分析.doc
- 变压器着火事故应急预案(用)【可编辑】.doc
- 国内外社区商业综合研究.doc
- 手术分级目录(四级).doc
- 【初中经典名著阅读活动方】.doc
- 四子王旗发展苜蓿种植业的必要性研究.doc
- 大数据前沿技术及应用(一) 第一章 大数据行业生态在线考试..doc
- 大数据英语泛在学习生态系统.doc
- 变压器检修习题解答.doc
- 新能源汽车及电动乘用车消费者定量调查问卷(现实客户).doc
- 2025年河北省高职单招考试九类职业适应性测试(综合).docx
- 考研政治主观题技巧.docx
- 母乳喂养技巧教程.docx
- 2.1.2 影响化学反应速率的因素 课件-高二化学(人教版选择性必修1).pptx
- 2.3制取氧气 (课时1利用高锰酸钾制取氧气)九年级化学人教版(2024)上册.pptx
- 第14讲 国家出路的探索与列强侵略的加剧 课件-高三统编版必修中外历史纲要上一轮复习.pptx
- 2.2地表形态的变化第五课时 (风力侵蚀地貌)课件 高中地理湘教版(2019)选择性必修一.pptx
- 第11讲 清朝前中期的鼎盛与危机 课件 高三统编版必修中外历史纲要上一轮复习.pptx
- 7.3.2饮食中的化学--乙酸 课件 高一下学期化学人教版必修第二册.pptx
- 16.1《阿房宫赋》课件 统编版高一语文必修下册 (1).pptx
最近下载
- 四川蜀道集团招聘考试真题.pdf VIP
- 【餐饮】食品进货查验记录管理制度.docx VIP
- 应急--自然灾害人口综合风险评估技术规范.pdf VIP
- 2025年党员应知应会知识.doc VIP
- 深度解析(2026)《JTT 1402-2022 交通运输行政执法基础装备配备及技术要求》.pptx VIP
- 铁路线路及站场PPT完整全套教学课件.pptx VIP
- (正式版)D-L∕T 5861-2023 电化学储能电站初步设计内容深度规定.docx VIP
- 沪教版英语(三起)四年级上册(2024)期末综合素质达标(含答案,含听力原文,无听力音频).pdf VIP
- 中医医院病房改造提升项目社会稳定风险评估报告(范文参考).docx
- grandMA3D中文说明书(操作手册).pdf VIP
原创力文档


文档评论(0)