第七篇:稳定性之提升团队潜意识【提前预防、裕度设计】

本文主要是介绍第七篇:稳定性之提升团队潜意识【提前预防、裕度设计】,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

提前预防

提前预防是告诉我们从失败中学习,防止同样的故障再次发生,海因里希法则告诉我们,一次重大事故的背后必然有一百次未遂事件和几十次轻度损失。这个法则对于我们有两个启示:一是事故的发生必然有其关联起因和先发信号;二是事故发生前一定有足够的提示,我们要及时遏制苗头,防患于未然。

从失败中学习吸取经验教训,例如每次出现事故,都需要对事故进行复盘,分析和总结事故原因,包括事故处理过程,包括后期的改进措施,海因里希法则,通过本次事故发现其他可能存在的隐患,而非针对此次事故。

例如:数据库慢SQL,拖垮数据库CPU,从而导致应用程序无法为用户提供服务,那么针对此事故,可改进进行复盘,及后期改进措施,如下:

  • 对此次事故分析,是否有索引,如果没有,为何没有创建索引?
  • 创建索引,索引使用是否合理,如何评估?
  • 数据库建表或者查询等数据库设计规约是否强调索引创建意识?
  • 是否还有其他的慢SQL?
  • 如何通过手段或工具提前预防慢SQL?
  • 表结构设计是否合理?该如何评估?

上述是针对慢SQL事故进行复盘,及同类问题拷问,只有想清楚这些问题,并解决掉之后才可能避免风险,出现事故。

提前预防是某种意义也是一种面向失败设计,更多考虑当出现异常情况时,程序或者系统该如何为用户服务,例如:在对某接口设计过程中,对第三方接口依赖失败,考虑该依赖是否强弱依赖,可以解耦,一旦失败是否有预案,或者补救措施,是否考虑可以增加Redis缓存,如果此次失败,可以沿用上次结果,再或缓存失败,又该如何,是否本地缓存(LocalCache)等等很多案例,再例如:服务建议部署N+1来确保服务的高可用,防止单节点出现故障。

小结

每个研发人员都需要有提前预防这方面的意识,架构设计或者稳定性建设,都需要提前预防,我认为提前预防有两方面,一是从失败中学习,学习并吸取历史事故的经验,预防事故发生,二是面向失败设计,提前预知失败,从而提升程序的鲁棒性,提前预防,防患于未然。

裕度设计

在工程实践中,系统的稳定性是最重要的性能指标。正常运行系统的负载大小波动、环境条件改变等许多因素都会改变系统的工作点,即系统的参数会变化。一个可靠的系统,必须保证在参数可能的变化范围内都是稳定的。稳定裕度:表示系统在设计的工作点(设计参数)运行时,到系统处于临界稳定的距离(余地)。通俗的来讲就是设计过程中考虑到各种因素,故意多设计出的一部分,设计时留点余量,预防突发流量从而给系统带来隐患。

一般在做架构设计或者容量评估是估算出最终的结果之后,预留出30%资源,原因是不论是数据库还是服务器或其他资源,是不允许资源被打满,试下:CPU或者系统负载过高,那么一旦某台服务器过高,可能导致阻塞,阻塞一台机器之后,那么就会出现雪崩事件。

小结

裕度设计是告诉我们架构设计或者容量评估时,预留出30%资源,防止线上资源负载过高,跑到极限,从而引发雪崩现象,裕度设计和冗余设计是有一定的区别的,裕度设计是针对单服务或者单资源设计时,要预留出一定的资源,防止单体资源负载过高,跑到极限,而冗余设计是在单服务或单资源之外的设计,为了高可用预备,防止单机挂掉,无法提供服务。

这篇关于第七篇:稳定性之提升团队潜意识【提前预防、裕度设计】的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1109169

相关文章

C#使用yield关键字实现提升迭代性能与效率

《C#使用yield关键字实现提升迭代性能与效率》yield关键字在C#中简化了数据迭代的方式,实现了按需生成数据,自动维护迭代状态,本文主要来聊聊如何使用yield关键字实现提升迭代性能与效率,感兴... 目录前言传统迭代和yield迭代方式对比yield延迟加载按需获取数据yield break显式示迭

Python中的可视化设计与UI界面实现

《Python中的可视化设计与UI界面实现》本文介绍了如何使用Python创建用户界面(UI),包括使用Tkinter、PyQt、Kivy等库进行基本窗口、动态图表和动画效果的实现,通过示例代码,展示... 目录从像素到界面:python带你玩转UI设计示例:使用Tkinter创建一个简单的窗口绘图魔法:用

不懂推荐算法也能设计推荐系统

本文以商业化应用推荐为例,告诉我们不懂推荐算法的产品,也能从产品侧出发, 设计出一款不错的推荐系统。 相信很多新手产品,看到算法二字,多是懵圈的。 什么排序算法、最短路径等都是相对传统的算法(注:传统是指科班出身的产品都会接触过)。但对于推荐算法,多数产品对着网上搜到的资源,都会无从下手。特别当某些推荐算法 和 “AI”扯上关系后,更是加大了理解的难度。 但,不了解推荐算法,就无法做推荐系

怎么让1台电脑共享给7人同时流畅设计

在当今的创意设计与数字内容生产领域,图形工作站以其强大的计算能力、专业的图形处理能力和稳定的系统性能,成为了众多设计师、动画师、视频编辑师等创意工作者的必备工具。 设计团队面临资源有限,比如只有一台高性能电脑时,如何高效地让七人同时流畅地进行设计工作,便成为了一个亟待解决的问题。 一、硬件升级与配置 1.高性能处理器(CPU):选择多核、高线程的处理器,例如Intel的至强系列或AMD的Ry

基于51单片机的自动转向修复系统的设计与实现

文章目录 前言资料获取设计介绍功能介绍设计清单具体实现截图参考文献设计获取 前言 💗博主介绍:✌全网粉丝10W+,CSDN特邀作者、博客专家、CSDN新星计划导师,一名热衷于单片机技术探索与分享的博主、专注于 精通51/STM32/MSP430/AVR等单片机设计 主要对象是咱们电子相关专业的大学生,希望您们都共创辉煌!✌💗 👇🏻 精彩专栏 推荐订阅👇🏻 单片机

SprinBoot+Vue网络商城海鲜市场的设计与实现

目录 1 项目介绍2 项目截图3 核心代码3.1 Controller3.2 Service3.3 Dao3.4 application.yml3.5 SpringbootApplication3.5 Vue 4 数据库表设计5 文档参考6 计算机毕设选题推荐7 源码获取 1 项目介绍 博主个人介绍:CSDN认证博客专家,CSDN平台Java领域优质创作者,全网30w+

java学习,进阶,提升

http://how2j.cn/k/hutool/hutool-brief/1930.html?p=73689

JAVA用最简单的方法来构建一个高可用的服务端,提升系统可用性

一、什么是提升系统的高可用性 JAVA服务端,顾名思义就是23体验网为用户提供服务的。停工时间,就是不能向用户提供服务的时间。高可用,就是系统具有高度可用性,尽量减少停工时间。如何用最简单的方法来搭建一个高效率可用的服务端JAVA呢? 停工的原因一般有: 服务器故障。例如服务器宕机,服务器网络出现问题,机房或者机架出现问题等;访问量急剧上升,导致服务器压力过大导致访问量急剧上升的原因;时间和

单片机毕业设计基于单片机的智能门禁系统的设计与实现

文章目录 前言资料获取设计介绍功能介绍程序代码部分参考 设计清单具体实现截图参考文献设计获取 前言 💗博主介绍:✌全网粉丝10W+,CSDN特邀作者、博客专家、CSDN新星计划导师,一名热衷于单片机技术探索与分享的博主、专注于 精通51/STM32/MSP430/AVR等单片机设计 主要对象是咱们电子相关专业的大学生,希望您们都共创辉煌!✌💗 👇🏻 精彩专栏 推荐订

Spring的设计⽬标——《Spring技术内幕》

读《Spring技术内幕》第二版,计文柯著。 如果我们要简要地描述Spring的设计⽬标,可以这么说,Spring为开发者提供的是⼀个⼀站式的轻量级应⽤开发框架(平台)。 作为平台,Spring抽象了我们在 许多应⽤开发中遇到的共性问题;同时,作为⼀个轻量级的应⽤开发框架,Spring和传统的J2EE开发相⽐,有其⾃⾝的特点。 通过这些⾃⾝的特点,Spring充分体现了它的设计理念:在