- 17
- 0
- 约 7页
- 2017-02-06 发布于重庆
- 举报
spark集群部署
概述 本文是对spark1.6.0分布式集群的安装的一个详细说明,旨在帮助实施人员按照本说明能够快速搭建并使用spark集群。软件版本Scala2.10.6。Spark-1.6.0-bin-hadoop2.6.tgz。 Java jre 1.7。注:spark依赖jre 和scala。行为计算的spark集群依赖hadoop集群,所以请先部署hadoop集群。安装前准备在每台机添加hosts(root用户)修改文件/etc/hosts,添加各节点IP和主机名映射。安装jre。安装jre。配置环境变量。验证安装是否成功,执行命令java -version查看java版本。安装scala安装Scala。配置环境变量:配置SCALA_HOME,值为安装后的scala home目录。配置PATH,添加上$SCALA_HOME/bin。3.验证安装是否成功,执行命令 scala -version,查看scala版本。配置SSH免密码登录集群各个节点之间最好配置免密码登录。集群的master节点到zookeeper集群节点配置免密码登录。SPARK安装解压安装包到安装目录。配置环境变量。配置SPARK_HOME,值为安装后的spark home目录。配置PATH,添加上$SPARK_HOME/bin。SPARK配置配置文件所在目录:spark home目录下conf目录下。配置运行时环境1.基于spark-env.sh.template复制出一份新文件spark-env.sh。2.修改spark-env.sh添加如下环境变量:export SPARK_DAEMON_JAVA_OPTS=-Dspark.deploy.recoveryMode=ZOOKEEPER -Dspark.deploy.zookeeper.url=master:2181 -Dspark.deploy.zookeeper.dir=/sparkexport JAVA_HOME=/data/jdk7export SCALA_HOME=/data/scalaexport HADOOP_CONF_DIR=/data/hadoop-2.5.2/etc/hadoopexport SPARK_LOCAL_DIRS=/data/spark/tempdatas/spark_local_dirsexport SPARK_PID_DIR=/data/spark/tempdatas/spark_local_dirs/pid各个参数变量的含义见下表,请按实际值修改:SPARK_DAEMON_JAVA_OPTSspark.deploy.zookeeper.urlzookeeper主机名和端口号SPARK_DAEMON_JAVA_OPTSspark.deploy.zookeeper.dirzookeeper中存储spark元数据的目录SPARK_DAEMON_JAVA_OPTSjava.io.tmpdir临时io文件目录JAVA_HOMEJAVA_HOMEJava 安装目录SCALA_HOMESCALA_HOMEScala安装目录HADOOP_CONF_DIRHADOOP_CONF_DIRHadoop配置文件目录SPARK_LOCAL_DIRSSPARK_LOCAL_DIRSSpark运行时临时数据目录SPARK_PID_DIRSPARK_PID_DIRPid信息存储文件存放位置功能参数配置1.基于spark-defaults.conf.template复制出一份新的文件spark-defaults.conf2.修改spark-defaults.conf添加参数变量配置:spark.eventLog.enabled truespark.eventLog.dir hdfs://master:9000/spark/logsspark.history.fs.logDirectory hdfs://master:9000/spark/logsspark.deploy.retainedApplications 15spark.worker.cleanup.enabled erval 3600spark.executor.memory112gspark.driver.memory 5gspark.driver.maxResultSize 4gspark.serializerorg.apache.spark.serializer.KryoSwork.timeout300spark.logConf truespark.eventLpress truespark.shuffle.service.enabled truespark.rp
您可能关注的文档
- (总)输血不良反应处理制度与流程.doc
- 03-1信管培养方案.doc
- ---山东农业大学数字化校园建设规划方案---重点参考.doc
- 04社区专业知识(不打印).doc
- 06_嘉讯移动代理服务器(MAS)售后服务内容及承诺.doc
- 10G光模块在数字化视频监控的应用特点.docx
- 10个关于数字电影的基本概念.docx
- 07第七节随机变量的数字特征.doc
- 12-无人机作业在数字化城市建设中的应用2500.doc
- ---内蒙古建筑职业技术学院数字化校园建设方案V1_2---重点参考.doc
- 2025年全国演出经纪人员资格认定考试试卷带答案(研优卷).docx
- 2025年全国演出经纪人员资格认定考试试卷完整版.docx
- 2025年全国演出经纪人员资格认定考试试题库及完整答案.docx
- 2025年全国演出经纪人员资格认定考试试卷完美版.docx
- 2025年全国演出经纪人员资格认定考试试卷含答案(实用).docx
- 2025年全国演出经纪人员资格认定考试试卷及答案(各地真题).docx
- 2025年下半年内江市部分事业单位公开考试招聘工作人员(240人)备考题库附答案.docx
- 2025年全国演出经纪人员资格认定考试试卷及答案1套.docx
- 2025年下半年四川成都市郫都区面向社会引进公共类事业单位人员2人备考题库最新.docx
- 2025年下半年内江市部分事业单位公开考试招聘工作人员(240人)备考题库附答案.docx
最近下载
- 2024年北京市公务员录用开始考《申论》题(含答案).docx VIP
- 重庆市北碚区中国移动数据中心二期岩土工程勘察设计.docx VIP
- 职业能力倾向测验事业单位考试试题与参考答案(2025年).docx VIP
- 2026年煤矿企业开工安全第一课讲座课件.pptx
- 2024届高考物理二轮专题复习与测试第一部分专题五热学光学原子物理第13讲热学命题点四气体状态变化的图像分析方法.pdf VIP
- 2025年西安铁路职业技术学院单招职业技能测试题库(各地真题).docx VIP
- 全优课堂 数学 人教必修第一册 课件期中综合检测卷.pptx
- 职业能力倾向测验事业单位考试试题与参考答案(2025年).docx VIP
- 2024版碎石破碎生产线租赁合同.docx VIP
- 2024年事业单位考试职业能力倾向测验试题与参考答案.pdf VIP
原创力文档

文档评论(0)