语雀停服8小时,P0级事故,故障原因和补偿来了。

2023-10-25 18:45

本文主要是介绍语雀停服8小时,P0级事故,故障原因和补偿来了。,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

昨天互联网圈子里发生了一件大事,那就是语雀的 P0 级事故,前后足足停服了 7 个多小时,放眼整个互联网的发展史,都是相当炸裂的表现。

语雀是技术大牛玉伯在蚂蚁金服内部孵化出来的一个云端知识库,整体的界面非常清爽,书写方式也非常丝滑,所以得到了不少小伙伴的青睐,我自己也是语雀的重度用户。

我平常的知识库,也都托管在语雀平台上,因为我觉得比较适合沉浸式地阅读。

昨天 16.46 我还技术交流群里发了一个通知,说《Java 面试指南》中又收录了不少新的面经和学习心得,小伙伴们可以刷一波了,然后就有不少小伙伴反馈说语雀已经崩了,内容无法查看。

不少小伙伴应该都是语雀的重度用户,相信大家对这波事故背后的原因非常好奇,说好的高可用、异地多活、容灾备份、两地三中心呢?面试的时候不是经常问吗?真遇到事了,又解决不了?

况且背靠蚂蚁金服这么牛逼的大厂,7 个多小时才搞定?那些所谓的技术大牛都去干嘛了?

语雀官方给出的解释是,由于数据量过于庞大,所以从备份系统中恢复存储数据花费了比较久的时间,从 15.10 分一直持续到 19 点才完成数据恢复,后来又用了 3 个多小时进行数据完整性的校验和联调,所以直到 22 点才终于结束这场闹剧。

并且官方给出了一个相对友好的解决方案,所有语雀的个人用户,赠送 6 个月的会员服务。

大家一定要记得领一下,我自己又续费了 2 年,一共 198 元,支持语雀一把。毕竟我已经是语雀的重度用户,数据统计里显示我已经创作了 30 万+字,厚厚好几本书了。

针对语雀这次故障,有小伙伴调侃说是因为维修文档在语雀里面,这个我觉得不太可能哈,语雀不至于蠢到连本地服务都没做。

我猜想的原因是,之前负责这块运维的老员工因为一些原因离职了(你懂的),导致目前维护语雀的员工在第一次遇到这个问题时傻眼了,就算是对照着文档也不知道怎么去操作。

想想也是,如果换成是我遇到这种故障,估计人当场就傻眼了,精神高度紧张,会的东西也不会了,毕竟这可是 P0 级事故,年终奖没了不说,后续可能还要背锅。

能处理好吗?

处理不好,所以,运维这个岗位平常可能看上去没啥用,运维搞的事情一个资深后端也能搞定,可真遇到事了,还得是有经验的上啊。

当然,时间耗这么久,肯定还有开会和汇报的时间占了大头,这种事故肯定大老板是要介入的。

话说,这次解决问题的员工下次面试时就可以自信满满地说:“劳资当年可是处理过语雀 P0 级事故的程序员。”说完这句话,后面估计就不用再继续面了,直接录用发 offer 就对了,这可是宝藏级的程序员啊。

所以,大家平常遇到比较重大的 bug 时一定要记得更新一波自己的简历,这绝对是加分项(😂)。

这篇关于语雀停服8小时,P0级事故,故障原因和补偿来了。的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/284508

相关文章

IDEA编译报错“java: 常量字符串过长”的原因及解决方法

《IDEA编译报错“java:常量字符串过长”的原因及解决方法》今天在开发过程中,由于尝试将一个文件的Base64字符串设置为常量,结果导致IDEA编译的时候出现了如下报错java:常量字符串过长,... 目录一、问题描述二、问题原因2.1 理论角度2.2 源码角度三、解决方案解决方案①:StringBui

部署Vue项目到服务器后404错误的原因及解决方案

《部署Vue项目到服务器后404错误的原因及解决方案》文章介绍了Vue项目部署步骤以及404错误的解决方案,部署步骤包括构建项目、上传文件、配置Web服务器、重启Nginx和访问域名,404错误通常是... 目录一、vue项目部署步骤二、404错误原因及解决方案错误场景原因分析解决方案一、Vue项目部署步骤

pip install jupyterlab失败的原因问题及探索

《pipinstalljupyterlab失败的原因问题及探索》在学习Yolo模型时,尝试安装JupyterLab但遇到错误,错误提示缺少Rust和Cargo编译环境,因为pywinpty包需要它... 目录背景问题解决方案总结背景最近在学习Yolo模型,然后其中要下载jupyter(有点LSVmu像一个

SpringBoot中的404错误:原因、影响及解决策略

《SpringBoot中的404错误:原因、影响及解决策略》本文详细介绍了SpringBoot中404错误的出现原因、影响以及处理策略,404错误常见于URL路径错误、控制器配置问题、静态资源配置错误... 目录Spring Boot中的404错误:原因、影响及处理策略404错误的出现原因1. URL路径错

在Rust中要用Struct和Enum组织数据的原因解析

《在Rust中要用Struct和Enum组织数据的原因解析》在Rust中,Struct和Enum是组织数据的核心工具,Struct用于将相关字段封装为单一实体,便于管理和扩展,Enum用于明确定义所有... 目录为什么在Rust中要用Struct和Enum组织数据?一、使用struct组织数据:将相关字段绑

Linux内存泄露的原因排查和解决方案(内存管理方法)

《Linux内存泄露的原因排查和解决方案(内存管理方法)》文章主要介绍了运维团队在Linux处理LB服务内存暴涨、内存报警问题的过程,从发现问题、排查原因到制定解决方案,并从中学习了Linux内存管理... 目录一、问题二、排查过程三、解决方案四、内存管理方法1)linux内存寻址2)Linux分页机制3)

Vue项目中Element UI组件未注册的问题原因及解决方法

《Vue项目中ElementUI组件未注册的问题原因及解决方法》在Vue项目中使用ElementUI组件库时,开发者可能会遇到一些常见问题,例如组件未正确注册导致的警告或错误,本文将详细探讨这些问题... 目录引言一、问题背景1.1 错误信息分析1.2 问题原因二、解决方法2.1 全局引入 Element

Window Server创建2台服务器的故障转移群集的图文教程

《WindowServer创建2台服务器的故障转移群集的图文教程》本文主要介绍了在WindowsServer系统上创建一个包含两台成员服务器的故障转移群集,文中通过图文示例介绍的非常详细,对大家的... 目录一、 准备条件二、在ServerB安装故障转移群集三、在ServerC安装故障转移群集,操作与Ser

windos server2022的配置故障转移服务的图文教程

《windosserver2022的配置故障转移服务的图文教程》本文主要介绍了windosserver2022的配置故障转移服务的图文教程,以确保服务和应用程序的连续性和可用性,文中通过图文介绍的非... 目录准备环境:步骤故障转移群集是 Windows Server 2022 中提供的一种功能,用于在多个

MySQL不使用子查询的原因及优化案例

《MySQL不使用子查询的原因及优化案例》对于mysql,不推荐使用子查询,效率太差,执行子查询时,MYSQL需要创建临时表,查询完毕后再删除这些临时表,所以,子查询的速度会受到一定的影响,本文给大家... 目录不推荐使用子查询和JOIN的原因解决方案优化案例案例1:查询所有有库存的商品信息案例2:使用EX