基于IDEA使用Spark API开发Spark程序.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于IDEA使用Spark API开发Spark程序.doc

基于IDEA使用Spark API开发Spark程序 清明假期折腾了两天,总结了两种方式使用IDE进行spark程序,记录一下: 第一种方法比较简单,两种方式都是采用SBT进行编译的。 注意:本地不需要安装Scala程序,否则在编译程序时有版本兼容性问题。 一、基于Non-SBT方式 创建一个Scala IDEA工程 我们使用Non-SBT的方式,点击“Next” 命名工程,其他按照默认 点击“Finish”完成工程的创建 修改项目的属性 首先修改Modules选项 在src下创建两个文件夹,并把其属性改为source 下面修改Libraries 将Spark开发需要的jar包导进来 加入后: 导入包完成后,在工程的scala下面创建一个package 创建一个Object对象 构建Spark Driver代码 该程序是对搜狗日志的处理代码 接下来进行打包,使用Project Structure的Artifacts 使用From modules with dependencies 选择Main Class 点击“OK” 把名称改为FirstSparkAppJar 因为每台机器上都安装了Scala和Spark,所以可以把Scala和Spark相关的jar文件都删掉 接下来进行Build 选择“Build Artifacts” 第一次选择Build,以后同一个工程要选择Rebuild,然后等待编译完成 下面使用spark-submit运行程序 最后任务运行完成 二、基于SBT方式 开发工具下载 Spark开发需要以下开发编译工具: 1、Scala IDE:本文以IntelliJ IDEA为例进行开发,下载地址: /idea/download/ 2、SBT(Simple Build Tool)编译工具下载: /download.html 下载安装后,在DOS下执行sbt命令下载其所需要的jar包: 默认jar包(.idea-build、.ivy2、.sbt)下载到C盘用户目录下 (注意:使用命令sbt进行下载时要确保网速,最好使用代理下载) 开发工具配置 1、IntelliJ IDEA开发配置: (1) 下载Scala插件:选择Configure下的Plugins进入下图 选择Install JetBrains plugin,搜索Scala进行下载。 (2) 创建基于SBT的Scala工程: (3) 设置工程名称以及Scala和SBT版本: 注意: 最好将Download两个选项取消,否则会覆盖之前用户目录下的SBTjar包,造成编译不通过等错误 SBT和Scala的版本号在C盘用户目录下可以看出: C:\Users\用户\.sbt\boot\scala-2.10.4\org.scala-sbt\sbt\0.13.8 这里可以一次性设置正确,也可以后续修改配置文件(build.sbt修改scala版本,perties修改sbt版本)进行修改同步。 工程路径不要使用中文,否则即使编译成功打成jar包也无法执行。 (4) 基于SBT的Scala程序对工程的结构要求比较苛刻,需要建立如下目录结构: (5) 添加Spark插件: 注意:同时该插件需要添加到lib目录下(操作系统复制即可) 准备工作完成,下面进行Spark程序开发 编写代码 下面以类wordcount程序为例: 编写Spark程序: 请不要使用InteiiJ IDEA进行编译(汉字导致后面编译不过去) 编译和执行 (1)使用SBT进行编译和打包: DOS下进入工程目录下,使用sbt命令进行编译和打包: 默认打的jar在工程目录test\target\scala-2.10下 (2)将jar包上传到服务器执行: 使用命令: spark-submit --class test--master yarn test_2.10-0.1-SNAPSHOT.jar 100 更多的参数详见官方文档 有兴趣朋友可以了解更多java教程 /java/video.shtml

文档评论(0)

cai + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档