博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
spark 2.4安装
阅读量:4307 次
发布时间:2019-06-06

本文共 948 字,大约阅读时间需要 3 分钟。

1、spark 官网选择对应Hadoop的版本,之前安装的Hadoop版本为hadoop-3.0.2,获取下载包:
wget http://mirrors.hust.edu.cn/apache/spark/spark-2.4.0/spark-2.4.0-bin-hadoop2.7.tgz
 
2、解压缩安装包,创建软连接:
tar -zxvf spark-2.4.0-bin-hadoop2.7.tgz
ln -s spark-2.4.0-bin-hadoop2.7 spark
 
3、配置spark,进入conf目录:
1)、配置spark-env.sh 文件
先拷贝:cp spark-env.sh.template spark-env.sh
文件增加内容如下:
export JAVA_HOME=/usr/local/src/jdk1.8.0_191 #Java环境变量
export SCALA_HOME=/usr/local/src/scala/scala-2.12.7 #SCALA环境变量
export SPARK_WORKING_MEMORY=521m #每一个worker节点上可用的最大内存
export SPARK_MASTER_IP=master #驱动器节点IP
export HADOOP_HOME=/usr/local/src/hadoop-3.0.2 #Hadoop路径
export HADOOP_CONF_DIR=$HADOOP_HOME/etc/hadoop #Hadoop配置目录
 
2)、配置slave主机
先拷贝:cp slaves.template slaves
文件中增加slave节点名称:
slave1
slave2
 
3)、将spark 目录发送给salve1和slave2
scp -r spark root@slave1:/usr/local/src/
scp -r spark root@slave2:/usr/local/src/
 
4)、启动spark
cd sbin目录,执行./start-all.sh
 
5)、节点启动了worker进程
 

转载于:https://www.cnblogs.com/lihao7/p/10092846.html

你可能感兴趣的文章
消息队列2
查看>>
C++ 线程同步之临界区CRITICAL_SECTION
查看>>
测试—自定义消息处理
查看>>
MFC中关于虚函数的一些问题
查看>>
根据图层名获取图层和图层序号
查看>>
规范性附录 属性值代码
查看>>
提取面狭长角
查看>>
Arcsde表空间自动增长
查看>>
Arcsde报ora-29861: 域索引标记为loading/failed/unusable错误
查看>>
记一次断电恢复ORA-01033错误
查看>>
C#修改JPG图片EXIF信息中的GPS信息
查看>>
从零开始的Docker ELK+Filebeat 6.4.0日志管理
查看>>
How it works(1) winston3源码阅读(A)
查看>>
How it works(2) autocannon源码阅读(A)
查看>>
How it works(3) Tilestrata源码阅读(A)
查看>>
How it works(12) Tileserver-GL源码阅读(A) 服务的初始化
查看>>
uni-app 全局变量的几种实现方式
查看>>
echarts 为例讲解 uni-app 如何引用 npm 第三方库
查看>>
uni-app跨页面、跨组件通讯
查看>>
springmvc-helloworld(idea)
查看>>