standalone安装部署

2024-02-19 08:20

文章标签 部署安装 standalone

本文主要是介绍standalone安装部署，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

standalone是spark的资源调度服务；作用和yarn是一样的；
standlone运行时的服务：

master服务；主服务；管理整个资源调度；资源的申请需要通过master进行分配；类似于yarn里的ResourceManager;（只有一个，是单点故障；一旦master有故障整个服务不可用）
woke服务；从服务；根据master的分配创建资源空间；给计算任务使用；类似于yarn里面的nodemanager；（可以运行在多台服务器；）

安装部署：

所有集群都有安装python和anaconda;

先分发给其他两个节点：

分别在两个节点安装;

重新连接；出现（base）即可；表示成功；

vim ~/.condarc

将master的内容复制过来即可；

channels:- defaults
show_channel_urls: true
default_channels:- https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main- https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/r- https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/msys2
custom_channels:conda-forge: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloudmsys2:https: //mirrors.tuna.tsinghua.edu.cn/anaconda/cloudbioconda: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud    menpo: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud    pytorch: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloudsimpleitk: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud

分别在两台上创建pyspark虚拟机；

conda create -n pyspark python=3.8

验证一下

conda activate pyspark

表示成功；

分别执行以下两点：

vim /etc/peofile

export SPARK_HOME=/opt/module/spark
export PYSPARK_PYTHON=/opt/module/anacond3/envs/pyspark/bin/python3.8
export HADOOP_CONF_DIR=$HADOOP_HOME/etc/hadoop

vim .bashrc

export JAVA_HOME=/opt/module/jdk
export PYSPARK_PYTHON=/opt/module/anacond3/envs/pyspark/bin/python3.8

接下来修改spark的配置文件：

master节点：

cd /opt/module/spark/conf

vim workers.template

master
slave1
slave2

vim spark-env.sh

# 设置JAVA安装目录
JAVA_HOME=/export/server/jdk
## HAD00P软件配置文件目录，读取HDFS上文件和运行YARN集群HAD00P_CONF_DIR=/export/server/hadoop/etc/hadoop
YARN_CONF_DIR=/export/server/hadoop/etc/hadoop
## 指定spark老大Master的IP和提交任务的通信端口告知spark的master运行在哪个机器上第
export SPARK_MASTER_HOST=master
#告知sparkmaster的通讯端口
export SPARK_MASTER_PORT=7077
#告知spark master的 webui端囗
SPARK_MASTER_WEBUI_PORT=8080# worker cpu可用核数
SPARK_WORKER_CORES=1
# worker可用内存
SPARK_WORKER_MEMORY=1g
# worker的工作通讯地址
SPARK_WORKER_PORT=7078
#worker的webui地
SPARK_WORKER_WEBUI_PORT=8081
# 设置历史服务器
#配置的意思是 将spark程序运行的历史日志 存到ndfs的/sparklog文件夹中
SPARK_HISTORY OPTS="-
Dspark.history.fs.logDirectory=hdfs://master:8020/sparklog/-Dspark.history.fs.cleaner.enabled=true"

hadoop fs -ls /

查看有没有sparklog；没有就创建：

hadoop fs -mkdir /sparklog

修改权限：

hadoop fs -chmod 777 /sparklog

mv spark-defaults.conf.template spark-defaults.conf

vim spark-defaults.conf

写入：

# 开启spark的日期记录功能
spark.eventlog.enabled true
#设置spark日志记录路径
spark.eventlog.dir hdfs://master:8020/sparklog/
#设置spark日志是否启动压缩
spark.eventlog.compress true

mv log4j.properties.template log4j.properties

vim log4j.properties

把info改为warn；

然后分发即可；

scp -r /opt/module/spark/ slave1:/opt/module/
scp -r /opt/module/spark/ slave2:/opt/module/

-------------

启动spark的历史服务器：
sbin/start-history-server.sh
jobhistoryserver出不来可以执行如下：
mapred --daemon start historyserver

这篇关于standalone安装部署的文章就介绍到这儿，希望我们推荐的文章对编程师们有所帮助！

standalone安装部署

安装部署：

相关文章

虚拟机Centos7安装MySQL数据库实践

MySQL 主从复制部署及验证(示例详解)

JAVA中安装多个JDK的方法

Java JDK1.8 安装和环境配置教程详解

SQL server数据库如何下载和安装

golang程序打包成脚本部署到Linux系统方式

如何在Ubuntu 24.04上部署Zabbix 7.0对服务器进行监控

Python中win32包的安装及常见用途介绍

gitlab安装及邮箱配置和常用使用方式

MySQL MCP 服务器安装配置最佳实践