本文主要是介绍zabbix故障自愈,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
故障自治愈功能:
当zabbix 监控到指定的监控项异常的时候,通过指定的操作使故障自动恢复,通常是重启服务等一些简单的操作,也可以调用脚本执行比较复杂的操作。
设置监控项和触发器,新建动作,在触发条件里面添加操作,在远程主机通过zabbix 客户端执行命令
1.开启zabbix sudo权限
2.配置允许允许特殊字符
3.配置远程命令
4.验证和测试
zabbix agent需要开启远程命令执行:
root@zabbix-web:~# vim /etc/zabbix/zabbix_agentd.conf
73 EnableRemoteCommands=1 #开启远程执行命令
287 UnsafeUserParameters=1 #允许远程执行命令的时候使用不安全的参数(特殊字符串)
root@zabbix-node4:~# systemctl restart zabbix-agent
zabbix用户授权:
如果zabbix agent是使用zabbix用户启动的,那么要在zabbix 用户授权使用特权命令,否则有些命令zabbix没有权 限执行,会导致定义好的自治愈策略因为权限拒绝为执行失败。
root@zabbix-web:~# vim /etc/sudoers
55 # Defaults !visiblepw #不强制使用tty
93 zabbix ALL = NOPASSWD: ALL #授权指定用户执行特殊命令不再需要密码,比如sudo等
在zabbix网页上创建动作
配置动作,添加触发器
创建执行脚本操作
将需要测试的服务关闭
创建的zabbix网页上的自治愈脚本就会生效,等待1-2分钟,服务就会自动启动,实现了基本上的服务宕机之后能再次启动的效果,这种方法也适用于JAVA、tomcat、redis等服务器上的自治愈,针对某些功能执行某些脚本即可。
这种方式对于假死状态无用,需要添加脚本。根据生产环境来写
执行脚本sudo bash 加脚本路劲
这篇关于zabbix故障自愈的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!