2个区域网络互联后,客户业务中断——排障

2023-12-27 14:52

本文主要是介绍2个区域网络互联后,客户业务中断——排障,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

免责声明
本文旨在提供信息和解决问题的建议,观点和建议可能不适用于个人情况,仅供参考!!!
文章中所有敏感信息已经修改,对于因本文中提供的信息而导致的任何直接或间接损失或损害不承担责任。
使用本文中的信息和建议,即表示您已阅读、理解并接受本免责声明的条款和条件。

场景说明

故障承接上回ACL实现固定时间访问资源——项目,客户2个区域的网络,本来是分开的,现在需要区域1的PC可以访问区域2的server。上篇文章已经说明了,根据客户需求PC在指定时间段可以访问server,在真机环境下测试,可以实现这个功能。现将配置导入现网环境,接上互联线路。

故障情况

将SW1和SW2互联后,客户立刻反馈,区域2下vlan200的PC无法上网;区域1下用户也有用户反馈,内网网站登不上。

网络拓扑

请添加图片描述

排查过程

客户反馈无法上网后,立刻中断SW1和SW2的互联线路,保证用户业务恢复。中断后,1分钟内,业务恢复正常
在这里插入图片描述
初步猜想是否为STP收敛,产生的网络中断。
现网环境
区域1 在G0/0/1上开启了STP disable。
区域2 接入交换机变动频繁,为了防止变动新交换机,产生STP收敛(影响业务),SW2核心以及汇聚交换机上,均将STP关闭了(这样有接入变动,只影响该接入交换机的用户),仅接入和次级接入交换机开启了STP。
该情况导致,每台接入交换机都是根桥,端口状态为指定状态
在这里插入图片描述
在这里插入图片描述
由于有大量vlan200下的用户上不了网, 且无法通过查看STP信息,查看各接入STP的具体情况。所以,这边我想通过查看日志,看看有没有端口状态迁移,有的话就说明,sw1和sw2互联了,引起了stp收敛。(这边迁移的端口是连PC的端口,当时没注意,认为就是stp引起的网络重新收敛
在这里插入图片描述从这开始,方向错了,不过还可以接着看,学下思路
因为区域2的核心与汇聚stp全局和接口下都是关闭的,所以当时以为是SW1发送的BPDU透传到接入上,引起的收敛。
在这里插入图片描述
后来发现SW1的G0/0/1接口的stp是关闭的,接口STP关闭,交换机不会往外发送BPDU报文,理论上互联也不会接入交换机重新收敛。
所以我在SW2的G0/0/1上抓包查看收到对端传来的STP报文,并在SW1的g0/0/1上开启关闭stp去观察报文接收情况。
在这里插入图片描述
在这里插入图片描述
抓包发现,不是互联后STP重新收敛了。BPDU都没过去,所以上不了网和STP没关系
在这里插入图片描述
那之前,那个端口状态迁移是啥情况)
重新回去看了一下日志,他确实是MSTP set 端口状态迁移,不过是由于终端的开机关机导致的,是终端的端口状态迁移。
在这里插入图片描述
这边查了一下,发现开启了边缘端口,终端的开机关机会报端口状态迁移这个日志。
没开边缘端口,终端的开机关机的日志是up down。(涨知识了
在这里插入图片描述
至此,毫无头绪,断网是啥情况,于是等到晚上,业务系统不再使用的时候,去现网复现这个问题


分割线


复现前准备工作
我们在各网段找了台主机,长ping 网关和baidu.com
部分网络禁ping ,ping不了百度,这里我们采用telnet baidu.com 443 端口看是否能通

这里仅贴出区域2下的PC状态截图)
区域1 区域2 互联前,VLAN200下PC ping 网关可通,ping baidu.com 可解析出域名
在这里插入图片描述
在这里插入图片描述
互联后,VLAN200下主机断网,ping 网关可通 , ping 百度找不主机
在这里插入图片描述
找不主机,即域名解析失败,是dns的问题。
更换114.114.114.114通用的DNS后,发现可以正常上网。(这里已经确定是某条与DNS有关的策略的问题
在这里插入图片描述
后来,排查发现,SW2有一条策略路由,针对区域2 PC使用的DNS,将下一跳重定向到SW1上去了,PC的流量无法从自己SW2的出口正常出去;从SW1走,也没有路由能从SW1的出口出去,故上不了网。
删除这条策略,网络恢复正常。
原区域1内,有用户反馈,内网网站登不上,后经过排查发现,是巧合情况,实际并不是本次互联导致的。特殊情况,加大了排障范围
在这里插入图片描述

这篇关于2个区域网络互联后,客户业务中断——排障的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/543492

相关文章

Linux系统配置NAT网络模式的详细步骤(附图文)

《Linux系统配置NAT网络模式的详细步骤(附图文)》本文详细指导如何在VMware环境下配置NAT网络模式,包括设置主机和虚拟机的IP地址、网关,以及针对Linux和Windows系统的具体步骤,... 目录一、配置NAT网络模式二、设置虚拟机交换机网关2.1 打开虚拟机2.2 管理员授权2.3 设置子

揭秘Python Socket网络编程的7种硬核用法

《揭秘PythonSocket网络编程的7种硬核用法》Socket不仅能做聊天室,还能干一大堆硬核操作,这篇文章就带大家看看Python网络编程的7种超实用玩法,感兴趣的小伙伴可以跟随小编一起... 目录1.端口扫描器:探测开放端口2.简易 HTTP 服务器:10 秒搭个网页3.局域网游戏:多人联机对战4.

SpringBoot使用OkHttp完成高效网络请求详解

《SpringBoot使用OkHttp完成高效网络请求详解》OkHttp是一个高效的HTTP客户端,支持同步和异步请求,且具备自动处理cookie、缓存和连接池等高级功能,下面我们来看看SpringB... 目录一、OkHttp 简介二、在 Spring Boot 中集成 OkHttp三、封装 OkHttp

Linux系统之主机网络配置方式

《Linux系统之主机网络配置方式》:本文主要介绍Linux系统之主机网络配置方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录一、查看主机的网络参数1、查看主机名2、查看IP地址3、查看网关4、查看DNS二、配置网卡1、修改网卡配置文件2、nmcli工具【通用

使用Python高效获取网络数据的操作指南

《使用Python高效获取网络数据的操作指南》网络爬虫是一种自动化程序,用于访问和提取网站上的数据,Python是进行网络爬虫开发的理想语言,拥有丰富的库和工具,使得编写和维护爬虫变得简单高效,本文将... 目录网络爬虫的基本概念常用库介绍安装库Requests和BeautifulSoup爬虫开发发送请求解

如何通过海康威视设备网络SDK进行Java二次开发摄像头车牌识别详解

《如何通过海康威视设备网络SDK进行Java二次开发摄像头车牌识别详解》:本文主要介绍如何通过海康威视设备网络SDK进行Java二次开发摄像头车牌识别的相关资料,描述了如何使用海康威视设备网络SD... 目录前言开发流程问题和解决方案dll库加载不到的问题老旧版本sdk不兼容的问题关键实现流程总结前言作为

SSID究竟是什么? WiFi网络名称及工作方式解析

《SSID究竟是什么?WiFi网络名称及工作方式解析》SID可以看作是无线网络的名称,类似于有线网络中的网络名称或者路由器的名称,在无线网络中,设备通过SSID来识别和连接到特定的无线网络... 当提到 Wi-Fi 网络时,就避不开「SSID」这个术语。简单来说,SSID 就是 Wi-Fi 网络的名称。比如

Java实现任务管理器性能网络监控数据的方法详解

《Java实现任务管理器性能网络监控数据的方法详解》在现代操作系统中,任务管理器是一个非常重要的工具,用于监控和管理计算机的运行状态,包括CPU使用率、内存占用等,对于开发者和系统管理员来说,了解这些... 目录引言一、背景知识二、准备工作1. Maven依赖2. Gradle依赖三、代码实现四、代码详解五

第10章 中断和动态时钟显示

第10章 中断和动态时钟显示 从本章开始,按照书籍的划分,第10章开始就进入保护模式(Protected Mode)部分了,感觉从这里开始难度突然就增加了。 书中介绍了为什么有中断(Interrupt)的设计,中断的几种方式:外部硬件中断、内部中断和软中断。通过中断做了一个会走的时钟和屏幕上输入字符的程序。 我自己理解中断的一些作用: 为了更好的利用处理器的性能。协同快速和慢速设备一起工作

Linux 网络编程 --- 应用层

一、自定义协议和序列化反序列化 代码: 序列化反序列化实现网络版本计算器 二、HTTP协议 1、谈两个简单的预备知识 https://www.baidu.com/ --- 域名 --- 域名解析 --- IP地址 http的端口号为80端口,https的端口号为443 url为统一资源定位符。CSDNhttps://mp.csdn.net/mp_blog/creation/editor