Azkaban集群模式部署详细教程

2024-04-07 00:12

本文主要是介绍Azkaban集群模式部署详细教程,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

序言

    Azkaban是一个用于工作流程调度和任务调度的开源工具,它可以帮助用户轻松地管理和监控复杂的工作流程。Azkaban的架构设计旨在提供高度可扩展性和可靠性,同时保持易用性和灵活性。

    Azkaban的架构可以分为三个主要组件:Executor、Web Server和db数据库。Executor是执行实际工作的节点,WebServer是用于用户交互的接口,数据库用于存储工作流程和任务的元数据信息。

(1)Executor

      Executor是Azkaban的工作节点,负责执行工作流程中定义的任务。每个Executor节点可以同时执行多个任务,通过与Web Server的通信来获取任务的执行信息和结果,Executor节点可以根据需要动态扩展,以满足不同规模和性能需求。同时,Executor节点可以配置不同的资源限制,以确保任务执行的稳定性和可靠性。

 (2)Web Server

    Web Server是Azkaban的用户界面,用户可以通过Web界面来管理和监控工作流程。Web Server提供了创建、编辑、删除工作流程的功能,同时也可以查看任务的执行情况和日志信息。        Web Server与Executor节点之间通过HTTP协议进行通信,通过RESTAPI来传递任务的执行信息和结果。Web Server还可以通过WebSocket实时监控任务的执行进度和状态。

 (3)db数据库

    数据库是Azkaban的元数据存储,用于保存工作流程和任务的定义信息。数据库中包含了工作流程的依赖关系、任务的执行状态和日志信息等。
     Azkaban支持多种数据库,如MySQL、PostgreSQL等,用户可以根据自己的需求选择合适的数据库存储方式。数据库的高可用性和性能也是保证系统稳定性的重要因素。

1. 集群模式设计

 准备4台服务器 hadoop101、hadoop102、hadoop103、hadoop104

 4台服务器的分工:

 hadoop101: Web Server、Executor Server

 hadoop102: Executor Server

 hadoop103:Executor Server

 hadoop104:MySQL数据库

2. Azkaban安装文件的准备

  包含:azkaban-db、azkaban-web-server、azkaban-exec-server 三个模块的安装文件,例如:

 上述对用三个文件的创建方式,请参考如下连接:

Azkaban下载/安装及单机版配置详细教程-CSDN博客

 2.1 在hadoop101服务器上创建/usr/local/software/azkaban 目录,将以上相关的三个文件下载到此目录下:

2.2 解压三个文件并重命名

3. 配置MySQL数据库

3.1  MySQL数据库安装,请参考如下连接:

CentOS7下MySQL-8.1.0 数据库下载及安装_centosxiazaishujvku-CSDN博客

3.2 登录MySQL数据库,创建azkaban数据库

  create database azkaban;

3.3 创建azkaban用户并设置权限

 create user 'azkaban'@'%' identified by '123456';

Grant SELECT,INSERT,UPDATE,DELETE ON azkaban.* to 'azkaban'@'%' WITH GRANT OPTION;

3.4 切换 azkaban数据库,并在数据库中导入azkaban表(create-all-sql-xxx.sql)

    备注:create-all-sql-xxx.sql 文件 在 azkaban-db 文件夹中,如下: 3.5. 更改MySQL包大小:防止Azkaban连接MySQL阻塞

  修改 /etc/my.cnf 文件,在[mysqld] 下面添加 max_allowed_packet = 1024M

3.6. 重启MySQL数据库

 systemctl restart mysqld

4. 配置Executor Server

 Azkaban Executor Server 处理工作流和作业的实际执行

4.1 修改:/azkaban-executor/conf/azkaban.properties ,修改内容如下:

default.timezone.id=Asia/Shanghai

azkaban.webserver.url=http://hadoop101:8081

executor.port=12321

database.type=mysql
mysql.port=3306
mysql.host=192.168.170.100
mysql.database=azkaban
mysql.user=azkaban
mysql.password=123456
mysql.numconnections=100

备注:executor.port 设置 executor server的端口号,因为executor.port不指定的话,每次executor.port 会随机生成,使用时特别不方便

 4.2 将配置好的 azkaban-executor 文件,复制到 hadoop102、hadoop103 服务器上

scp -r azkaban-exec/ root@192.168.170.102:/usr/local/software/azkaban/

scp -r azkaban-exec/ root@192.168.170.103:/usr/local/software/azkaban/

4.3 分别启动三台服务器的 executor server,进入到 azkaban-exector 根目录,进行执行:

  bin/start-exec.sh

 并通过jps 查看进程 

 备注:(1) azkaban-exec 项目中自带的是mysql 5.x 的驱动,如果你使用的mysql版本是8.x 的版本,则需要将 mysql 8.x的驱动包,复制到 azkaban-exec/lib 目录下,并将自带的mysql5.x 版本的驱动包删除掉

           (2)azkaban-exec 启动成功之后,在azkaban-exec目录下生成 executor.port 文件

4.4  激活每台executor服务器

  分别在三台服务器上执行如下命令:

 curl -G "hadoop101:12321/executor?action=activate" && echo

 curl -G "hadoop102:12321/executor?action=activate" && echo

 curl -G "hadoop103:12321/executor?action=activate" && echo

效果如下:

激活之后,可以在azkaban对应的数据库中的executors表中查看到激活的executor节点的信息,active 表示该节点服务器是否被激活,其实只要当你的executor 服务器启动之后,该表就会添加一条对应的信息,只不过active的数据是0,未激活的状态,激活之后active的数据变为1.

 

到此 Azkaban的Executor Server 已经配置与启动成功。

关闭服务使用的是:bin/shutdown-exec.sh

5. 配置 Web Server

 Azkaban Web Server 是处理项目管理、身份验证、计划和执行触发。

 当前案例 Web Server只是在 hadoop101 上进行配置

5.1 配置/修改 azkaban.properties 文件

default.timezone.id=Asia/Shanghai

mysql.port=3306
mysql.host=192.168.170.100
mysql.database=azkaban
mysql.user=azkaban
mysql.password=123456

azkaban.executorselector.filters=StaticRemainingFlowSize,CpuStatus

备注:azkaban.executorselector.filters 表示执行选择器的过滤器

          StaticRemainingFlowSize:正在排队的任务数

          CpuStatus:CPU占用情况

          MininumFreeMemory:内存占用情况。测试环境,必须将MininumFreeMemory删除掉,否则它会认为集群资源不够,不执行。

5.2 修改azkaban-users.xml 文件

  添加 laoma 用户 并设置密码为 laoma,角色设置为 admin

5.3  azkaban-web 项目中自带的是mysql 5.x 的驱动,如果你使用的mysql版本是8.x 的版本,则需要将 mysql 8.x的驱动包,复制到 azkaban-web/lib 目录下,并将自带的mysql5.x 版本的驱动包删除掉

5.4 启动 Web Server

 进入到 azkaban-web 的根目录下执行:bin/start-web.sh 并通过 jps 查看进程

5.5 通过浏览器访问azkaban web服务

  http://192.168.170.101:8081

 登录刚才设置的用户,例如我刚才设置的用户名:laoma 密码:laoma

登录成功!

5.6 关闭web Server 命令

 bin/shutdown-web.sh

至此 Web Server 配置成功!

至此,Azkaban集群模式配置完美结束!

这篇关于Azkaban集群模式部署详细教程的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/881199

相关文章

ElasticSearch+Kibana通过Docker部署到Linux服务器中操作方法

《ElasticSearch+Kibana通过Docker部署到Linux服务器中操作方法》本文介绍了Elasticsearch的基本概念,包括文档和字段、索引和映射,还详细描述了如何通过Docker... 目录1、ElasticSearch概念2、ElasticSearch、Kibana和IK分词器部署

部署Vue项目到服务器后404错误的原因及解决方案

《部署Vue项目到服务器后404错误的原因及解决方案》文章介绍了Vue项目部署步骤以及404错误的解决方案,部署步骤包括构建项目、上传文件、配置Web服务器、重启Nginx和访问域名,404错误通常是... 目录一、vue项目部署步骤二、404错误原因及解决方案错误场景原因分析解决方案一、Vue项目部署步骤

Java调用DeepSeek API的最佳实践及详细代码示例

《Java调用DeepSeekAPI的最佳实践及详细代码示例》:本文主要介绍如何使用Java调用DeepSeekAPI,包括获取API密钥、添加HTTP客户端依赖、创建HTTP请求、处理响应、... 目录1. 获取API密钥2. 添加HTTP客户端依赖3. 创建HTTP请求4. 处理响应5. 错误处理6.

Spring AI集成DeepSeek的详细步骤

《SpringAI集成DeepSeek的详细步骤》DeepSeek作为一款卓越的国产AI模型,越来越多的公司考虑在自己的应用中集成,对于Java应用来说,我们可以借助SpringAI集成DeepSe... 目录DeepSeek 介绍Spring AI 是什么?1、环境准备2、构建项目2.1、pom依赖2.2

Linux流媒体服务器部署流程

《Linux流媒体服务器部署流程》文章详细介绍了流媒体服务器的部署步骤,包括更新系统、安装依赖组件、编译安装Nginx和RTMP模块、配置Nginx和FFmpeg,以及测试流媒体服务器的搭建... 目录流媒体服务器部署部署安装1.更新系统2.安装依赖组件3.解压4.编译安装(添加RTMP和openssl模块

Goland debug失效详细解决步骤(合集)

《Golanddebug失效详细解决步骤(合集)》今天用Goland开发时,打断点,以debug方式运行,发现程序并没有断住,程序跳过了断点,直接运行结束,网上搜寻了大量文章,最后得以解决,特此在这... 目录Bug:Goland debug失效详细解决步骤【合集】情况一:Go或Goland架构不对情况二:

0基础租个硬件玩deepseek,蓝耘元生代智算云|本地部署DeepSeek R1模型的操作流程

《0基础租个硬件玩deepseek,蓝耘元生代智算云|本地部署DeepSeekR1模型的操作流程》DeepSeekR1模型凭借其强大的自然语言处理能力,在未来具有广阔的应用前景,有望在多个领域发... 目录0基础租个硬件玩deepseek,蓝耘元生代智算云|本地部署DeepSeek R1模型,3步搞定一个应

Ubuntu固定虚拟机ip地址的方法教程

《Ubuntu固定虚拟机ip地址的方法教程》本文详细介绍了如何在Ubuntu虚拟机中固定IP地址,包括检查和编辑`/etc/apt/sources.list`文件、更新网络配置文件以及使用Networ... 1、由于虚拟机网络是桥接,所以ip地址会不停地变化,接下来我们就讲述ip如何固定 2、如果apt安

redis群集简单部署过程

《redis群集简单部署过程》文章介绍了Redis,一个高性能的键值存储系统,其支持多种数据结构和命令,它还讨论了Redis的服务器端架构、数据存储和获取、协议和命令、高可用性方案、缓存机制以及监控和... 目录Redis介绍1. 基本概念2. 服务器端3. 存储和获取数据4. 协议和命令5. 高可用性6.

Python itertools中accumulate函数用法及使用运用详细讲解

《Pythonitertools中accumulate函数用法及使用运用详细讲解》:本文主要介绍Python的itertools库中的accumulate函数,该函数可以计算累积和或通过指定函数... 目录1.1前言:1.2定义:1.3衍生用法:1.3Leetcode的实际运用:总结 1.1前言:本文将详