使用蓝鲸自愈平台完成java项目程序的自愈机制

2023-10-22 11:20

本文主要是介绍使用蓝鲸自愈平台完成java项目程序的自愈机制,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

使用蓝鲸自愈平台完成java项目程序的自愈机制

1.蓝鲸自愈平台

官方文档

故障自愈是行业领先的"故障自动化处理"解决方案,提升企业的服务可用性和降低故障处理的人力投入,实现故障自愈从"人工处理"到"无人值守"的变革!

自愈平台可以根据连接配置好的监控平台,当收到我们指定要自愈的监控告警时,首先筛选出告警信息的ip地址,再匹配该服务器所在的集群节点,确认服务器信息,然后将服务器地址传到对应的作业平台的某个作业里,通过作业的具体恢复脚本,实现项目的故障资源机制。

实现步骤:

  • 首先配置一个告警源

  • 准备故障资源的作业平台脚本

  • 然后配置一个自愈套餐,调用作业平台

  • 最后接入自愈

2.配置告警源

在菜单 [接入自愈] -> [管理告警源] 中,点击 启用 Zabbix。

-w1423

跳转到接入流程页面

-w1487

登陆zabbix服务器操作以下步骤

cd /usr/lib/zabbix/alertscripts
wget 'http://${PaaS_Host}/o/bk_fta_solutions/0/alarm_source/scripts/zabbix_fta_alarm.py?fta_application_id=66fdfe50-3075-49bf-8101-d97386030c9b&fta_application_secret=EfgBbXD25N6870j9nkgf3ns8eOEsH2Sk' -O /usr/lib/zabbix/alertscripts/zabbix_fta_alarm.py --no-check-certificate
chmod  +x zabbix_fta_alarm.py
./zabbix_fta_alarm.py --init http://${Zabbix_Host}/api_jsonrpc.php  Admin zabbix

该脚本会创建一个名为FTA_Event_Handler的 报警媒介,名为 FTA_Act 的 Action,名为 FTA_Mgr 的用户。

-w1475

3.新建一个作业平台

点击作业执行—>新建作业—>填写作业名称—>填写脚本内容

在这里插入图片描述

脚本内容如下

#!/bin/bashanynowtime="date +'%Y-%m-%d %H:%M:%S'"
NOW="echo [\`$anynowtime\`][PID:$$]"##### 可在脚本开始运行时调用,打印当时的时间戳及PID。
function job_start
{echo "`eval $NOW` job_start"
}##### 可在脚本执行成功的逻辑分支处调用,打印当时的时间戳及PID。 
function job_success
{MSG="$*"echo "`eval $NOW` job_success:[$MSG]"exit 0
}##### 可在脚本执行失败的逻辑分支处调用,打印当时的时间戳及PID。
function job_fail
{MSG="$*"echo "`eval $NOW` job_fail:[$MSG]"exit 1
}job_start###### 可在此处开始编写您的脚本逻辑代码
###### 作业平台中执行脚本成功和失败的标准只取决于脚本最后一条执行语句的返回值
###### 如果返回值为0,则认为此脚本执行成功,如果非0,则认为脚本执行失败#输出告警信息
echo "告警信息:`echo $1`"
echo $1
#输出自愈机器IP
ip=`ifconfig |grep 192.168 | awk '{print $2}' |awk -F ':' '{print $2}'`
echo "自愈机器IP: ${ip}"#指定tomcat所在路径
tomcat_path=/data/tomcat#剩余内存容量
free_memory=`free  -g | grep Mem | awk '{print $4}'`
echo "服务器剩余内存:${free_memory} GB"#要自愈的tomcat名称
tomcat_name=`echo $1 | awk '{print $1}'`#输出当前tomcat服务所使用的端口号
port=`grep 'Connector port=' ${tomcat_path}/${tomcat_name}/conf/server.xml  | grep 'protocol="HTTP/1.1"' | egrep -o "[0-9]{4,5}"`
echo "服务端口:${port}"#自愈项目
if [[ "$ip" == "192.168.5.91" ]] || [[ "$ip" == "192.168.5.92" ]];thenecho "开始重启${tomcat_name}"#ps aux | grep ${tomcat_name} | grep -v grep | awk '{print \$2}' | xargs kill -9${tomcat_path}/${tomcat_name}/bin/startup.shsleep 10s
fi#检查项目是否启动成功
for i in {1..20}
dosleep 3secho "第$i次尝试"ava=`curl curl -s http://${ip}:${port}/test_ping`if [[ "$ava" = "true" ]];thenecho "${tomcat_name}自愈成功"breakfiif [ $i -ge 20 ];thenecho "项目自愈不成功!!!"exit 1fi
done

4.新建一个自愈套餐

按下图填写

在这里插入图片描述

5.接入自愈

在这里插入图片描述

这篇关于使用蓝鲸自愈平台完成java项目程序的自愈机制的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/261116

相关文章

java如何解压zip压缩包

《java如何解压zip压缩包》:本文主要介绍java如何解压zip压缩包问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录Java解压zip压缩包实例代码结果如下总结java解压zip压缩包坐在旁边的小伙伴问我怎么用 java 将服务器上的压缩文件解压出来,

SpringBoot中SM2公钥加密、私钥解密的实现示例详解

《SpringBoot中SM2公钥加密、私钥解密的实现示例详解》本文介绍了如何在SpringBoot项目中实现SM2公钥加密和私钥解密的功能,通过使用Hutool库和BouncyCastle依赖,简化... 目录一、前言1、加密信息(示例)2、加密结果(示例)二、实现代码1、yml文件配置2、创建SM2工具

Spring WebFlux 与 WebClient 使用指南及最佳实践

《SpringWebFlux与WebClient使用指南及最佳实践》WebClient是SpringWebFlux模块提供的非阻塞、响应式HTTP客户端,基于ProjectReactor实现,... 目录Spring WebFlux 与 WebClient 使用指南1. WebClient 概述2. 核心依

Spring Boot @RestControllerAdvice全局异常处理最佳实践

《SpringBoot@RestControllerAdvice全局异常处理最佳实践》本文详解SpringBoot中通过@RestControllerAdvice实现全局异常处理,强调代码复用、统... 目录前言一、为什么要使用全局异常处理?二、核心注解解析1. @RestControllerAdvice2

Spring IoC 容器的使用详解(最新整理)

《SpringIoC容器的使用详解(最新整理)》文章介绍了Spring框架中的应用分层思想与IoC容器原理,通过分层解耦业务逻辑、数据访问等模块,IoC容器利用@Component注解管理Bean... 目录1. 应用分层2. IoC 的介绍3. IoC 容器的使用3.1. bean 的存储3.2. 方法注

Python内置函数之classmethod函数使用详解

《Python内置函数之classmethod函数使用详解》:本文主要介绍Python内置函数之classmethod函数使用方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地... 目录1. 类方法定义与基本语法2. 类方法 vs 实例方法 vs 静态方法3. 核心特性与用法(1编程客

Spring事务传播机制最佳实践

《Spring事务传播机制最佳实践》Spring的事务传播机制为我们提供了优雅的解决方案,本文将带您深入理解这一机制,掌握不同场景下的最佳实践,感兴趣的朋友一起看看吧... 目录1. 什么是事务传播行为2. Spring支持的七种事务传播行为2.1 REQUIRED(默认)2.2 SUPPORTS2

怎样通过分析GC日志来定位Java进程的内存问题

《怎样通过分析GC日志来定位Java进程的内存问题》:本文主要介绍怎样通过分析GC日志来定位Java进程的内存问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录一、GC 日志基础配置1. 启用详细 GC 日志2. 不同收集器的日志格式二、关键指标与分析维度1.

Java进程异常故障定位及排查过程

《Java进程异常故障定位及排查过程》:本文主要介绍Java进程异常故障定位及排查过程,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录一、故障发现与初步判断1. 监控系统告警2. 日志初步分析二、核心排查工具与步骤1. 进程状态检查2. CPU 飙升问题3. 内存

Linux中压缩、网络传输与系统监控工具的使用完整指南

《Linux中压缩、网络传输与系统监控工具的使用完整指南》在Linux系统管理中,压缩与传输工具是数据备份和远程协作的桥梁,而系统监控工具则是保障服务器稳定运行的眼睛,下面小编就来和大家详细介绍一下它... 目录引言一、压缩与解压:数据存储与传输的优化核心1. zip/unzip:通用压缩格式的便捷操作2.