一个H3C交换机周期性断网并自动恢复的排查案例

2024-01-06 20:52

本文主要是介绍一个H3C交换机周期性断网并自动恢复的排查案例,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

        一个朋友发我一个H3C日志,这个交换机是汇聚层交换机,1和2口是trunk口,其它接口是access接口,17-21口据说接的都是监控、终端。日志里面看到大量的拓朴改变,好几个网口up、down的日志,怀疑是环路,排除了本机环路后,我让他对access端口开启了端口保护,然后就排查两个trunk口的问题

        我怀疑两个trunk口,可能一个是上联到核心,一个是下联接入,一般上联存在环路的可能性较小,有可能是下联交换机的问题,但同时有这么多口子,包括trunk和access端口短时间密集发生拓朴改变有点匪夷所思,会不会是下层交换机之间有环路,但朋友提出:如果环路,网络不会恢复,查了下H3C手册:有这样一段话:

1. 环路监测处理模式
环路监测的处理模式,就是系统监测到环路时的处理方式,分为以下两种:
l              None模式:当监测到端口出现环路时,除打印日志信息和发送告警信息外,不对该端口进行任何处理。
l              Shutdown模式:当监测到端口出现环路时,除打印日志信息并发送告警信息外,还会关闭该端口,使其不能收发报文(包括环路监测报文)。

        说明环路默认情况下是只记录日志,不做任何处理的,于是到下联的trunk端口开了环路检测,结果没有查到环路。(H3C关于环路检测的文章:14-环路检测命令-新华三集团-H3C

14-环路检测命令-新华三集团-H3C)

        突然想到以前处理过一个案例:就是上游锐捷交换机一开启stp,一台下游的老的H3C(V5版本)的trunk口就down掉了,因为日志里有这样一条:bpdu格式错误,后来在H3C的trunk口设置了stp compliance dot1s        //表示端口只发送标准格式(符合802.1s协议)的MSTP报文,网络就正常了。会不会是不同品牌的交换机的bpdu报文造成的呢?

        于是查了下知了社区:有这么一条回答:配置了bpdu保护、边缘端口后还是有大量BPDU TC日志,原因是stp模式不一致导致,因为公司内网有思科,华为,H3C,迈普等等交换机,因此stp用的是PVST,而H3C默认的是MSTP,导致以上配置配完还是有大量TC。因此要更改STP 模式stp mode pvst

        因为网络太乱了,朋友说找不到下游的交换机在哪里!所以出现故障,要多方查找可能的故障原因,一一排除。现在只有等梳理好网络再说了~ 所以说有个好的网络习惯真的很重要啊!

        最后,跟朋友提议:老的网络最好批量做一下版本升级,可以避免一些不兼容的情况出现;监控和办公网最好划分到不同的网段,这样网络拓朴更简洁易于梳理、减少广播包、将来做策略也更方便些。

这篇关于一个H3C交换机周期性断网并自动恢复的排查案例的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/577583

相关文章

python实现自动登录12306自动抢票功能

《python实现自动登录12306自动抢票功能》随着互联网技术的发展,越来越多的人选择通过网络平台购票,特别是在中国,12306作为官方火车票预订平台,承担了巨大的访问量,对于热门线路或者节假日出行... 目录一、遇到的问题?二、改进三、进阶–展望总结一、遇到的问题?1.url-正确的表头:就是首先ur

Spring使用@Retryable实现自动重试机制

《Spring使用@Retryable实现自动重试机制》在微服务架构中,服务之间的调用可能会因为一些暂时性的错误而失败,例如网络波动、数据库连接超时或第三方服务不可用等,在本文中,我们将介绍如何在Sp... 目录引言1. 什么是 @Retryable?2. 如何在 Spring 中使用 @Retryable

TP-LINK/水星和hasivo交换机怎么选? 三款网管交换机系统功能对比

《TP-LINK/水星和hasivo交换机怎么选?三款网管交换机系统功能对比》今天选了三款都是”8+1″的2.5G网管交换机,分别是TP-LINK水星和hasivo交换机,该怎么选呢?这些交换机功... TP-LINK、水星和hasivo这三台交换机都是”8+1″的2.5G网管交换机,我手里的China编程has

最便宜的8口2.5G网管交换机! 水星SE109 Pro拆机测评

《最便宜的8口2.5G网管交换机!水星SE109Pro拆机测评》水星SE109Pro价格很便宜,水星SE109Pro,外观、接口,和SE109一样,区别Pro是网管型的,下面我们就来看看详细拆... 听说水星SE109 Pro开卖了,PDD卖 220元,于是买回来javascript拆机看看。推荐阅读:水

使用 Python 和 LabelMe 实现图片验证码的自动标注功能

《使用Python和LabelMe实现图片验证码的自动标注功能》文章介绍了如何使用Python和LabelMe自动标注图片验证码,主要步骤包括图像预处理、OCR识别和生成标注文件,通过结合Pa... 目录使用 python 和 LabelMe 实现图片验证码的自动标注环境准备必备工具安装依赖实现自动标注核心

QT实现TCP客户端自动连接

《QT实现TCP客户端自动连接》这篇文章主要为大家详细介绍了QT中一个TCP客户端自动连接的测试模型,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录版本 1:没有取消按钮 测试效果测试代码版本 2:有取消按钮测试效果测试代码版本 1:没有取消按钮 测试效果缺陷:无法手动停

Hadoop企业开发案例调优场景

需求 (1)需求:从1G数据中,统计每个单词出现次数。服务器3台,每台配置4G内存,4核CPU,4线程。 (2)需求分析: 1G / 128m = 8个MapTask;1个ReduceTask;1个mrAppMaster 平均每个节点运行10个 / 3台 ≈ 3个任务(4    3    3) HDFS参数调优 (1)修改:hadoop-env.sh export HDFS_NAMENOD

使用SecondaryNameNode恢复NameNode的数据

1)需求: NameNode进程挂了并且存储的数据也丢失了,如何恢复NameNode 此种方式恢复的数据可能存在小部分数据的丢失。 2)故障模拟 (1)kill -9 NameNode进程 [lytfly@hadoop102 current]$ kill -9 19886 (2)删除NameNode存储的数据(/opt/module/hadoop-3.1.4/data/tmp/dfs/na

性能分析之MySQL索引实战案例

文章目录 一、前言二、准备三、MySQL索引优化四、MySQL 索引知识回顾五、总结 一、前言 在上一讲性能工具之 JProfiler 简单登录案例分析实战中已经发现SQL没有建立索引问题,本文将一起从代码层去分析为什么没有建立索引? 开源ERP项目地址:https://gitee.com/jishenghua/JSH_ERP 二、准备 打开IDEA找到登录请求资源路径位置

深入探索协同过滤:从原理到推荐模块案例

文章目录 前言一、协同过滤1. 基于用户的协同过滤(UserCF)2. 基于物品的协同过滤(ItemCF)3. 相似度计算方法 二、相似度计算方法1. 欧氏距离2. 皮尔逊相关系数3. 杰卡德相似系数4. 余弦相似度 三、推荐模块案例1.基于文章的协同过滤推荐功能2.基于用户的协同过滤推荐功能 前言     在信息过载的时代,推荐系统成为连接用户与内容的桥梁。本文聚焦于