通过自动化运维实现无人值守的故障自愈

2024-04-12 17:28

本文主要是介绍通过自动化运维实现无人值守的故障自愈,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

        故障自愈指实时发现告警,预诊断分析,自动恢复故障,并打通周边系统实现故障的快速恢复。通过故障自愈提升企业网络系统可用性、降低排障处置人力投入,实现从“人工处置”到“无人值守”的转变。

        针对运维中对故障自愈能力的需求,北京智和信通在实时监控告警的基础上,搭载可视化运维配置模块,通过赋予用户自定义编辑故障自愈策略的能力,实现无需针对告警进行手动处置,只需预编排告警处理流程,平台根据场景自动触发,从而做到故障自愈。

第1章 故障自愈──以(磁盘爆满自动清理为例)

        对各类设备进行批量、定时、条件触发等操作,通过自动化执行实现在网络、设备出现故障时的自动排障和自愈,释放运维人力。下面以磁盘爆满自动清理为例,介绍如何通过智和网管平台实现故障自愈。

        效果要求:当服务器磁盘使用率超过90%时,触发自动清理策略,释放磁盘空间。

        第一步:将需要管理的服务器纳入平台进行监控,并将监视器设置为磁盘使用率超过90%进行严重告警。

        第二步:进入安管模块的运维编排菜单,创建磁盘爆满自动清理策略。根据真实排障过程,通过进行策略节点拖拽编排的方式规划自愈流程。

        第三步:配置触发方式。方式支持通过告警触发和通过时间触发两种方式进行,为实现故障自愈的效果,我们选择通过匹配告警的方式触发策略。

        编排流程配置完成后,设备出现对应的严重级别告警后,立即触发磁盘清理策略,自动执行编排内的操作,对故障进行校验和处置。并在执行过程中,对每一步处置操作进行记录形成日志,确保有迹可循。

第2章 自定义应急处置,实现多场景下故障自愈

        在故障自愈方案中,核心是精确定位告警并匹配到适宜用户应用场景的故障自愈策略。一个符合用户需求的自愈策略,将为用户节约80%的故障处理时间。

        因此,北京智和信通提供从实时监控异常状态到告警收敛降噪、定位故障根因的高精确告警方案,并通过可视化编排工具,支持以拖拽的方式快速简单地完成作业流程的配置,将复杂的运维工作和任务转变为一致的,可复用的、可度量和有效的工作流,实现自动化运维。

        故障自愈方案的整体流程从获取精准告警开始,到预诊断分析,判断告警类型和级别,一般告警触发自愈策略,平台进行自动恢复,严重复杂告警则通过告警通知、运维工单等形式通知运维管理人员,进行人工处理,从而实现故障的快速治愈。

第3章 实时发现异常,智能故障收敛

        智和信通故障自愈方案一体化集中监控各类IT资源,全量汇聚性能、事件、日志、流量等异常告警信息。充分利用积累的有效定障、排障经验,打通综合监控、IP合规性监测、流量透视、自动运维、运维工单等关联数据,实现从告警检测到排障恢复的全生命周期闭环管理。

3.1.实时监控,全面汇聚告警信息

        实时监控、感知全网性能状态,通过主动沦陷与日志解析的方式,动态呈现网络态势,覆盖网络中各类软硬件设备,洞察设备、资源、链路性能。采用多种告警机制,自定义配置告警阈值,从众多的状态信息和日志数据中,将零散的信息总结成当前态势并进行实时分析,对异常情况进行告警。

3.2.事件接收,日志汇总分析

        接收Trap、Syslog、Filter Alarm等事件信息和设备日志数据,集中存储、解析、提取有效信息,将事件与日志存储为可统计分析的结构化数据,呈现日志数据价值。根据对事件、日志数据的挖掘与分析,通过配置告警规则和场景,将异常日志自动转化为告警,定位其影响范围。

3.3.告警降噪,快速定位根因

        采用自动去重、风暴抑制、关联聚合、维护期时间屏蔽、依赖屏蔽等多种智能告警降噪机制,通过AI算法,对各类告警进行自动压缩收敛,减少90%的无效告警,抑制告警风暴,直达故障根因。包括事件过滤机制、故障事件上报机制、故障事件呈现过滤、故障事件入库过滤、故障事件确认等处理机制,有效避免误报和漏报。

        一步定位到发生故障的源头设备,基于混合算法,快速检索异常问题关联涉及的各项维度与影响范围,快速定位问题边界。及时进行排障处置,支持以拓扑图的方式回放历史告警下的设备告警变化、拓扑图和链路告警变化,支持快进、后退等播放操作,有效地预防更加严重的故障发生。

第4章 可视化场景编排,提升复杂故障处置能力

        方案具备拖拽式场景编排能力,可以灵活地定制运维场景,自动执行编排流程。整体运维操作过程和执行结果均以可视化的方式进行呈现。不限制作业流程及流程内节点配置数量,全面满足不同运维需求,同时支持高性能的多条编排流程并发执行,加快排障处置效率。

        平台内置多种原子运维命令,满足用户日常基本运维需求,同时支持用户配置专属策略,通过对原子策略的组合复用,实现针对不同运维场景的策略模板,满足不同设备在不同运维场景下的特有需求。

        通过可视化编排以拖拽的方式快速简单地完成作业流程的配置,将复杂的运维工作和任务转变为一致的,可复用的、可度量和有效的工作流,实现自动化运维。

        智和信通故障自愈方案通过“监控+运维+控制”相结合的方式,将日常所需的各类故障排查、处置工作以策略模板的形式提供给用户,确保每个操作安全高效,全面提升告警排障效率。

这篇关于通过自动化运维实现无人值守的故障自愈的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/897776

相关文章

C++使用栈实现括号匹配的代码详解

《C++使用栈实现括号匹配的代码详解》在编程中,括号匹配是一个常见问题,尤其是在处理数学表达式、编译器解析等任务时,栈是一种非常适合处理此类问题的数据结构,能够精确地管理括号的匹配问题,本文将通过C+... 目录引言问题描述代码讲解代码解析栈的状态表示测试总结引言在编程中,括号匹配是一个常见问题,尤其是在

Java实现检查多个时间段是否有重合

《Java实现检查多个时间段是否有重合》这篇文章主要为大家详细介绍了如何使用Java实现检查多个时间段是否有重合,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录流程概述步骤详解China编程步骤1:定义时间段类步骤2:添加时间段步骤3:检查时间段是否有重合步骤4:输出结果示例代码结语作

使用C++实现链表元素的反转

《使用C++实现链表元素的反转》反转链表是链表操作中一个经典的问题,也是面试中常见的考题,本文将从思路到实现一步步地讲解如何实现链表的反转,帮助初学者理解这一操作,我们将使用C++代码演示具体实现,同... 目录问题定义思路分析代码实现带头节点的链表代码讲解其他实现方式时间和空间复杂度分析总结问题定义给定

Java覆盖第三方jar包中的某一个类的实现方法

《Java覆盖第三方jar包中的某一个类的实现方法》在我们日常的开发中,经常需要使用第三方的jar包,有时候我们会发现第三方的jar包中的某一个类有问题,或者我们需要定制化修改其中的逻辑,那么应该如何... 目录一、需求描述二、示例描述三、操作步骤四、验证结果五、实现原理一、需求描述需求描述如下:需要在

如何使用Java实现请求deepseek

《如何使用Java实现请求deepseek》这篇文章主要为大家详细介绍了如何使用Java实现请求deepseek功能,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录1.deepseek的api创建2.Java实现请求deepseek2.1 pom文件2.2 json转化文件2.2

python使用fastapi实现多语言国际化的操作指南

《python使用fastapi实现多语言国际化的操作指南》本文介绍了使用Python和FastAPI实现多语言国际化的操作指南,包括多语言架构技术栈、翻译管理、前端本地化、语言切换机制以及常见陷阱和... 目录多语言国际化实现指南项目多语言架构技术栈目录结构翻译工作流1. 翻译数据存储2. 翻译生成脚本

如何通过Python实现一个消息队列

《如何通过Python实现一个消息队列》这篇文章主要为大家详细介绍了如何通过Python实现一个简单的消息队列,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录如何通过 python 实现消息队列如何把 http 请求放在队列中执行1. 使用 queue.Queue 和 reque

Python如何实现PDF隐私信息检测

《Python如何实现PDF隐私信息检测》随着越来越多的个人信息以电子形式存储和传输,确保这些信息的安全至关重要,本文将介绍如何使用Python检测PDF文件中的隐私信息,需要的可以参考下... 目录项目背景技术栈代码解析功能说明运行结php果在当今,数据隐私保护变得尤为重要。随着越来越多的个人信息以电子形

使用 sql-research-assistant进行 SQL 数据库研究的实战指南(代码实现演示)

《使用sql-research-assistant进行SQL数据库研究的实战指南(代码实现演示)》本文介绍了sql-research-assistant工具,该工具基于LangChain框架,集... 目录技术背景介绍核心原理解析代码实现演示安装和配置项目集成LangSmith 配置(可选)启动服务应用场景

使用Python快速实现链接转word文档

《使用Python快速实现链接转word文档》这篇文章主要为大家详细介绍了如何使用Python快速实现链接转word文档功能,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 演示代码展示from newspaper import Articlefrom docx import