【Keepalived】VIP同时在主备节点出现问题排查

2024-04-10 17:28

本文主要是介绍【Keepalived】VIP同时在主备节点出现问题排查,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

        在生产环境中,我们一般会使用 keepalived + nginx 来搭建一套两节点或者三节点的软件负载,nginx主要根据配置,为后端应用提供请求的反向代理和负载均衡的功能,而 keepalived 则主要用于检测nginx服务状态,并完成VIP在主、备节点之间的漂移。

        不过,在某些情况下,我们可能会遇到一个问题,就是VIP在主备节点上同时出现,这个问题一般是由于主、备节点无法正常通信,导致备节点认为主节点挂了,因此就将VIP设置给自己了。如下面所示,192.168.223.200这个VIP就在主、备节点上同时出现了。

主节点:
# systemctl status keepalived.service 
● keepalived.service - LVS and VRRP High Availability MonitorLoaded: loaded (/usr/lib/systemd/system/keepalived.service; enabled; vendor preset: disabled)Active: active (running) since 三 2024-04-10 14:49:23 CST; 22s agoDocs: man:keepalived(8)man:keepalived.conf(5)man:genhash(1)https://keepalived.orgProcess: 1080 ExecStart=/usr/local/keepalived/sbin/keepalived -f /etc/keepalived/keepalived.conf $KEEPALIVED_OPTIONS (code=exited, status=0/SUCCESS)Main PID: 1092 (keepalived)Tasks: 2CGroup: /system.slice/keepalived.service├─1092 /usr/local/keepalived/sbin/keepalived -f /etc/keepalived/keepalived.conf -D└─1097 /usr/local/keepalived/sbin/keepalived -f /etc/keepalived/keepalived.conf -D4月 10 14:49:26 vm-3rd89n7dd Keepalived_vrrp[1097]: Sending gratuitous ARP on ens33 for 192.168.223.200
4月 10 14:49:26 vm-3rd89n7dd Keepalived_vrrp[1097]: Sending gratuitous ARP on ens33 for 192.168.223.200
4月 10 14:49:26 vm-3rd89n7dd Keepalived_vrrp[1097]: Sending gratuitous ARP on ens33 for 192.168.223.200
4月 10 14:49:26 vm-3rd89n7dd Keepalived_vrrp[1097]: Sending gratuitous ARP on ens33 for 192.168.223.200
4月 10 14:49:31 vm-3rd89n7dd Keepalived_vrrp[1097]: (VI_1) Sending/queueing gratuitous ARPs on ens33 for 192.168.223.200
4月 10 14:49:31 vm-3rd89n7dd Keepalived_vrrp[1097]: Sending gratuitous ARP on ens33 for 192.168.223.200
4月 10 14:49:31 vm-3rd89n7dd Keepalived_vrrp[1097]: Sending gratuitous ARP on ens33 for 192.168.223.200
4月 10 14:49:31 vm-3rd89n7dd Keepalived_vrrp[1097]: Sending gratuitous ARP on ens33 for 192.168.223.200
4月 10 14:49:31 vm-3rd89n7dd Keepalived_vrrp[1097]: Sending gratuitous ARP on ens33 for 192.168.223.200
4月 10 14:49:31 vm-3rd89n7dd Keepalived_vrrp[1097]: Sending gratuitous ARP on ens33 for 192.168.223.200
# ip addr
1: lo: <LOOPBACK,UP,LOWER_UP> mtu 65536 qdisc noqueue state UNKNOWN group default qlen 1000link/loopback 00:00:00:00:00:00 brd 00:00:00:00:00:00inet 127.0.0.1/8 scope host lovalid_lft forever preferred_lft foreverinet6 ::1/128 scope host valid_lft forever preferred_lft forever
2: ens33: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc pfifo_fast state UP group default qlen 1000link/ether 00:0c:29:a2:1b:cf brd ff:ff:ff:ff:ff:ffinet 192.168.223.199/24 brd 192.168.223.255 scope global noprefixroute ens33valid_lft forever preferred_lft foreverinet 192.168.223.200/32 scope global ens33valid_lft forever preferred_lft foreverinet6 fe80::7565:47f4:3a2b:ae8d/64 scope link noprefixroute valid_lft forever preferred_lft forever
备节点
# systemctl status keepalived.service 
● keepalived.service - LVS and VRRP High Availability MonitorLoaded: loaded (/usr/lib/systemd/system/keepalived.service; enabled; vendor preset: disabled)Active: active (running) since 三 2024-04-10 14:51:29 CST; 3s agoDocs: man:keepalived(8)man:keepalived.conf(5)man:genhash(1)https://keepalived.orgProcess: 90867 ExecStart=/usr/local/keepalived/sbin/keepalived -f /etc/keepalived/keepalived.conf $KEEPALIVED_OPTIONS (code=exited, status=0/SUCCESS)Main PID: 90868 (keepalived)Tasks: 2CGroup: /system.slice/keepalived.service├─90868 /usr/local/keepalived/sbin/keepalived -f /etc/keepalived/keepalived.conf -D└─90869 /usr/local/keepalived/sbin/keepalived -f /etc/keepalived/keepalived.conf -D4月 10 14:51:31 vm-3f9h-45gds3nx Keepalived_vrrp[90869]: (VI_1) received an invalid passwd!
4月 10 14:51:32 vm-3f9h-45gds3nx Keepalived_vrrp[90869]: (VI_1) Receive advertisement timeout
4月 10 14:51:32 vm-3f9h-45gds3nx Keepalived_vrrp[90869]: (VI_1) Entering MASTER STATE
4月 10 14:51:32 vm-3f9h-45gds3nx Keepalived_vrrp[90869]: (VI_1) setting VIPs.
4月 10 14:51:32 vm-3f9h-45gds3nx Keepalived_vrrp[90869]: (VI_1) Sending/queueing gratuitous ARPs on ens33 for 192.168.223.200
4月 10 14:51:32 vm-3f9h-45gds3nx Keepalived_vrrp[90869]: Sending gratuitous ARP on ens33 for 192.168.223.200
4月 10 14:51:32 vm-3f9h-45gds3nx Keepalived_vrrp[90869]: Sending gratuitous ARP on ens33 for 192.168.223.200
4月 10 14:51:32 vm-3f9h-45gds3nx Keepalived_vrrp[90869]: Sending gratuitous ARP on ens33 for 192.168.223.200
4月 10 14:51:32 vm-3f9h-45gds3nx Keepalived_vrrp[90869]: Sending gratuitous ARP on ens33 for 192.168.223.200
4月 10 14:51:32 vm-3f9h-45gds3nx Keepalived_vrrp[90869]: Sending gratuitous ARP on ens33 for 192.168.223.200
# ip addr
1: lo: <LOOPBACK,UP,LOWER_UP> mtu 65536 qdisc noqueue state UNKNOWN group default qlen 1000link/loopback 00:00:00:00:00:00 brd 00:00:00:00:00:00inet 127.0.0.1/8 scope host lovalid_lft forever preferred_lft foreverinet6 ::1/128 scope host valid_lft forever preferred_lft forever
2: ens33: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc pfifo_fast state UP group default qlen 1000link/ether 00:0c:29:4a:4c:27 brd ff:ff:ff:ff:ff:ffinet 192.168.223.198/24 brd 192.168.223.255 scope global noprefixroute ens33valid_lft forever preferred_lft foreverinet 192.168.223.200/32 scope global ens33valid_lft forever preferred_lft foreverinet6 fe80::9a4b:ab8e:4493:81b0/64 scope link noprefixroute valid_lft forever preferred_lft forever

那为什么会出现主备节点无法正常通信呢?一般有以下几个原因:

1)主、备节点所在的服务器防火墙没有关闭(active-运行,inactive-关闭),可以使用下面的命令检查

systemctl status firewalld.service

2)主、备节点上的keepalived配置不一致,涉及的配置如下:

第一,检查虚拟路由配置:virtual_router_id(主、备节点配置必须一致)第二,检查主备节点的通信密码:auth_pass(主、备节点配置必须一致)

3)云上ECS服务器之间默认禁止互相通信(比如阿里云禁止组播),可以通过增加下面的单播配置来解决。

    unicast_src_ip 192.168.223.197unicast_peer {192.168.223.198192.168.223.199}

备注:197、198、199分别为集群的三个节点,unicast_src_ip 为本机IP,unicast_peer 为对端节点IP。

这篇关于【Keepalived】VIP同时在主备节点出现问题排查的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/891683

相关文章

解决systemctl reload nginx重启Nginx服务报错:Job for nginx.service invalid问题

《解决systemctlreloadnginx重启Nginx服务报错:Jobfornginx.serviceinvalid问题》文章描述了通过`systemctlstatusnginx.se... 目录systemctl reload nginx重启Nginx服务报错:Job for nginx.javas

Redis缓存问题与缓存更新机制详解

《Redis缓存问题与缓存更新机制详解》本文主要介绍了缓存问题及其解决方案,包括缓存穿透、缓存击穿、缓存雪崩等问题的成因以及相应的预防和解决方法,同时,还详细探讨了缓存更新机制,包括不同情况下的缓存更... 目录一、缓存问题1.1 缓存穿透1.1.1 问题来源1.1.2 解决方案1.2 缓存击穿1.2.1

vue解决子组件样式覆盖问题scoped deep

《vue解决子组件样式覆盖问题scopeddeep》文章主要介绍了在Vue项目中处理全局样式和局部样式的方法,包括使用scoped属性和深度选择器(/deep/)来覆盖子组件的样式,作者建议所有组件... 目录前言scoped分析deep分析使用总结所有组件必须加scoped父组件覆盖子组件使用deep前言

解决Cron定时任务中Pytest脚本无法发送邮件的问题

《解决Cron定时任务中Pytest脚本无法发送邮件的问题》文章探讨解决在Cron定时任务中运行Pytest脚本时邮件发送失败的问题,先优化环境变量,再检查Pytest邮件配置,接着配置文件确保SMT... 目录引言1. 环境变量优化:确保Cron任务可以正确执行解决方案:1.1. 创建一个脚本1.2. 修

Python 标准库time时间的访问和转换问题小结

《Python标准库time时间的访问和转换问题小结》time模块为Python提供了处理时间和日期的多种功能,适用于多种与时间相关的场景,包括获取当前时间、格式化时间、暂停程序执行、计算程序运行时... 目录模块介绍使用场景主要类主要函数 - time()- sleep()- localtime()- g

SpringBoot项目删除Bean或者不加载Bean的问题解决

《SpringBoot项目删除Bean或者不加载Bean的问题解决》文章介绍了在SpringBoot项目中如何使用@ComponentScan注解和自定义过滤器实现不加载某些Bean的方法,本文通过实... 使用@ComponentScan注解中的@ComponentScan.Filter标记不加载。@C

VMWare报错“指定的文件不是虚拟磁盘“或“The file specified is not a virtual disk”问题

《VMWare报错“指定的文件不是虚拟磁盘“或“Thefilespecifiedisnotavirtualdisk”问题》文章描述了如何修复VMware虚拟机中出现的“指定的文件不是虚拟... 目录VMWare报错“指定的文件不是虚拟磁盘“或“The file specified is not a virt

Mybatis提示Tag name expected的问题及解决

《Mybatis提示Tagnameexpected的问题及解决》MyBatis是一个开源的Java持久层框架,用于将Java对象与数据库表进行映射,它提供了一种简单、灵活的方式来访问数据库,同时也... 目录概念说明MyBATis特点发现问题解决问题第一种方式第二种方式问题总结概念说明MyBatis(原名

Redis连接失败:客户端IP不在白名单中的问题分析与解决方案

《Redis连接失败:客户端IP不在白名单中的问题分析与解决方案》在现代分布式系统中,Redis作为一种高性能的内存数据库,被广泛应用于缓存、消息队列、会话存储等场景,然而,在实际使用过程中,我们可能... 目录一、问题背景二、错误分析1. 错误信息解读2. 根本原因三、解决方案1. 将客户端IP添加到Re

centos7基于keepalived+nginx部署k8s1.26.0高可用集群

《centos7基于keepalived+nginx部署k8s1.26.0高可用集群》Kubernetes是一个开源的容器编排平台,用于自动化地部署、扩展和管理容器化应用程序,在生产环境中,为了确保集... 目录一、初始化(所有节点都执行)二、安装containerd(所有节点都执行)三、安装docker-