什么?你竟然不知道SRE工程师!

2024-03-09 06:32
文章标签 工程师 竟然 知道 sre

本文主要是介绍什么?你竟然不知道SRE工程师!,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

今天,我们来简单聊聊关于SRE工程师的那些事

在正式开始之前,我先跟大家讲一下我的个人经历:今年春招找实习的时候,依稀记得那是一个日暖风和的中午,我坐在电脑前,而网线的另一端是和蔼可亲的面试官——是的,我正在进行一场某企业的技术面试,岗位则是SRE工程师

在这里插入图片描述
面试的前半段,我跟面试官相谈甚欢,不亦乐乎。直到面试官突然问了我这么一个问题:“你觉得运维工程师和SRE工程师有什么区别?或者说他们的工作性质有什么不一样的地方吗?”

这个问题直接把我问住了,运维工程师跟SRE工程师有什么区别?SRE工程师全名叫啥来着?顿时一个个问题涌上我的脑海,我只能尴尬的笑着并跟面试官说:“不好意思面试官,这个问题我没有过多的去了解”

面试结束后,果不其然的“挂掉了”

在这里插入图片描述
回到宿舍后,我对今天的面试过程做了一个总结复盘,我决心要弄清楚SRE工程师到底是什么,以及他跟运维工程师有什么区别,不然这都不懂的话我还应聘什么SRE工程师。

好,正文开始。

什么是SRE工程师?

SRE这个词诞生于谷歌公司,其全名叫网站可靠性工程师(Site Reliability Engineer ),它是软件工程师和系统管理员的结合。

在SRE诞生之前,谷歌认为“既然软件工程师职业主要专注于设计和构建软件系统,那么应该有另外一种职业来专注于整个软件系统的生命管理周期”。

SRE工程师都干些什么?

SRE工程师在最初的时候,主要的工作是负责维护谷歌网站的正常运转,所以我们看到SRE中的"S"最开始指代的就是谷歌的网站业务。

任何一个软件或者系统,我们认为其可靠性(Reliability)是相当重要的。因为绝大多数的大型软件或者系统,它们的生命周期绝大部分都处于“使用”阶段,而非“设计”或者“实现”阶段。一旦你这个软件或系统投入到生产环境并正式使用后,你就得想尽办法让它的用户体验更好,这样才能留住用户,给公司带来利润对吧。

所以说,SRE工程师的主要任务之一就是:负责软件和系统的架构设计,运维流程的不断优化,让这些大型软件以及系统运行得更加可靠,更加稳定,扩展性更好,更能有效地利用计算机资源。

世界上第一个SRE是谁?

在《SRE Google运维解密》一书中,作者跟我们谈到了SRE的起源——Margaret Hamilton,MIT教授。
他参与了阿波罗登月计划的软件开发工作,在阿波罗七号飞船研发的某天,MIT教授带着他的小女儿Lauren一起来到公司。小孩子嘛,对于新鲜事物都特别好奇,所以就在MIT教授忙着和组员们在计算机上进行飞行模拟测试的时候,他的女儿Lauren不小心按下了控制台上的DSKY键,这一按可不得了——整个模拟程序直接崩溃,导致火箭发射程序意外终止。

之后MIT教授发现,是因为当时Lauren意外触发了P01程序的执行,所以才导致了程序的崩溃(这个子程序是起飞前调试程序,执行时会删除现存的导航信息,如果在火箭飞行过程中执行这个程序,计算机将无法继续维持火箭航线,后果可是灾难性的)

MIT教授凭着自己的直觉,为项目组提交了一个软件改动,申请在飞行程序中增加一项特殊状态检查,以免飞行员在飞行过程中意外触发P01子程序的执行

但不幸的是,NASA管理层认为,这项错误发生的可能性太小,如果要修改的话成本太大,根本不值得。
无奈MIT教授只能在火箭飞行手册中写道:“请勿触发P01程序”

当时增加这段文字的时候,很多同事都觉得MIT教授在小题大做,因为他们都认为宇航员在经过如此长时间的专业训练,几乎不可能会发生这种错误

几天后,阿波罗8号飞船在执行一项任务时。宇航员Jim Lovell、William Anders和Frank Borman三人执行一个长达四天的飞行计划途中,Jim Lovell意外触发了P01程序,好巧不巧,当时正好是美国的圣诞节,大部分工程师都休假去了。

可想而知,当时NASA处于一片混乱状态,如此人命关天的时刻如果不能及时解决,三名宇航员恐怕就回不来了。

所幸当时MIT教授的飞行手册更新中恰恰提到了这种情形,并且提供了重新上传数据以及恢复执行的有效办法,在有效的时间内解决了问题,并拯救了宇航员的生命。

最后,我想说的是:没有人能够毫不出错地去做一件事,即使他是这个领域内最顶尖的人才。无论对一个软件系统运行原理掌握得多么彻底,也不能阻止人犯意外错误!

上文我们对SRE工程师有了一个基本的了解,别忘了还有一个问题:SRE工程师跟运维工程师有什么区别?

我们先看看某招聘网上企业分别对SRE工程师和运维工程师的技能要求,当然这只是一个大概的需求而且我只放了一张图片,具体还得看不同企业。大家可以自行去某招聘网站上了解。

SRE工程师
在这里插入图片描述

运维工程师
在这里插入图片描述
我们可以看到,两个职业在技能需求上其实没有太大的差别,都需要了解Linux操作系统,熟悉编程语言或者脚本语言。那么为什么还会有SRE工程师和运维工程师呢?以及他们直接有没有特别明显的区别呢?

区别?

传统的IT行业中,许多企业大多都是雇佣系统管理员来运维复杂的软件或者系统。

这些系统管理员的日常工作和研发工程师(软件工程师)相差甚远,通常属于两个部门:开发部(Dev)和运维部(Ops),这个团队模型也就是Dev/Ops分离模型。

于是,系统管理员也被称作运维工程师,他们主要负责将线程的软件组件部署在生产环境当中,并对外提供某种业务服务。

与运维工程师不同的是。SRE工程师不但负责传统运维工程师的工作,他们也负责软件工程师的一些工作——参与某些软件或系统的开发。

SRE团队相信通过开发软件系统来维护系统的正常运行,以此来代替传统运维工程师的人工操作,这样做大大节省了人力开销。

SRE团队中实现的是DevOps结合模型,他们主张用系统来维护系统,让SRE工程师有更多时间来负责软件系统的开发,而不是每天进行重复枯燥的运维工作。

最后,做个小总结:

  • 随着IT行业的迅速发展,传统运维工程师已经不能满足企业的需求了,而SRE的诞生和DevOps理念刚好给企业提供了一个比较好的方案
  • SRE更强调的是开发系统来运维系统,所以SRE的工作不仅要运维,还要对系统进行开发。这样做的好处就是避免了大量的人力消耗以及重复的人工运维操作
  • 我们要重新造轮子,而不是重复造轮子

这篇关于什么?你竟然不知道SRE工程师!的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/789789

相关文章

计算机视觉工程师所需的基本技能

一、编程技能 熟练掌握编程语言 Python:在计算机视觉领域广泛应用,有丰富的库如 OpenCV、TensorFlow、PyTorch 等,方便进行算法实现和模型开发。 C++:运行效率高,适用于对性能要求严格的计算机视觉应用。 数据结构与算法 掌握常见的数据结构(如数组、链表、栈、队列、树、图等)和算法(如排序、搜索、动态规划等),能够优化代码性能,提高算法效率。 二、数学基础

《计算机视觉工程师养成计划》 ·数字图像处理·数字图像处理特征·概述~

1 定义         从哲学角度看:特征是从事物当中抽象出来用于区别其他类别事物的属性集合,图像特征则是从图像中抽取出来用于区别其他类别图像的属性集合。         从获取方式看:图像特征是通过对图像进行测量或借助算法计算得到的一组表达特性集合的向量。 2 认识         有些特征是视觉直观感受到的自然特征,例如亮度、边缘轮廓、纹理、色彩等。         有些特征需要通

未雨绸缪:环保专包二级资质续期工程师招聘时间策略

对于环保企业而言,在二级资质续期前启动工程师招聘的时间规划至关重要。考虑到招聘流程的复杂性、企业内部需求的变化以及政策标准的更新,建议环保企业在二级资质续期前至少提前6至12个月启动工程师招聘工作。这个时间规划可以细化为以下几个阶段: 一、前期准备阶段(提前6-12个月) 政策与标准研究: 深入研究国家和地方关于环保二级资质续期的最新政策、法规和标准,了解对工程师的具体要求。评估政策变化可

如何成为一个优秀的测试工程师

链接地址:http://blog.csdn.net/KerryZhu/article/details/5250504 我一直在想,如何将自己的测试团队打造成世界一流的团队?流程、测试自动化、创新、扁平式管理、国际标准制定、测试社区贡献、…… 但首先一点是明确的,就是要将每一个测试工程师打造成优秀的测试工程师,优秀的团队必须由优秀的成员构成。所以,先讨论“如何成为一个优秀的测试工程师”,

[情商-13]:语言的艺术:何为真实和真相,所谓真相,就是别人想让你知道的真相!洞察谎言与真相!

目录 前言: 一、说话的真实程度分级 二、说谎动机分级:善意谎言、中性谎言、恶意谎言 三、小心:所谓真相:只说对自己有利的真相 四、小心:所谓真相:就是别人想让你知道的真相 五、小心:所谓善解人意:就是别人只说你想要听到的话 前言: 何为真实和真相,所谓真相,就是别人想让你知道的真相!洞察谎言与真相! 人与人交流话语中,处处充满了不真实,完全真实的只是其中一小部分,这

看病要排队这个是地球人都知道的常识

归纳编程学习的感悟, 记录奋斗路上的点滴, 希望能帮到一样刻苦的你! 如有不足欢迎指正! 共同学习交流! 🌎欢迎各位→点赞 👍+ 收藏⭐ + 留言​📝唯有付出,才有丰富的果实收获! 看病要排队这个是地球人都知道的常识。 不过经过细心的0068的观察,他发现了医院里排队还是有讲究的。0068所去的医院有三个医生(汗,这么少)同时看病。而看病的人病情有轻重,所以不能根据简单的先来

纳米材料咋设计?蛋白质模块咋用?看这里就知道啦!

大家好,今天我们来了解一项关于蛋白质纳米材料设计的研究——《Blueprinting extendable nanomaterials with standardized protein blocks》发表于《Nature》。蛋白质结构复杂,其组装体的设计颇具挑战。但近期的研究取得了新突破,通过设计标准化的蛋白质模块,如线性、曲线和转角模块等,实现了纳米材料的可扩展性和规律性。这

文心快码前端工程师观点分享:人机协同新模式的探索之路(三)

本系列视频来自百度工程效能部的前端研发经理杨经纬,她在由开源中国主办的“AI编程革新研发效能”OSC源创会·杭州站·105期线下沙龙活动上,从一款文心快码(Baidu Comate)前端工程师的角度,分享了关于智能研发工具本身的研发历程和理念。 以下视频是关于【人机协同新模式的探索之路】的观点三。 人机协同新模式的探索之路(三) 经纬说: 那么第三个阶段,我们会进一步的去探索

只有对比,才知道伊利股份半年报的高成色

投资圈有句名言:“当潮水退去的时候,才知道谁在裸泳”。大环境顺风顺水,大家看着都挺好,只有环境变化,才更容易分辨出来,谁才是真有实力。当下,在消费环境弱复苏的大背景下,高成色的半年报业绩让伊利股份的实力一览无余。 8月29日,伊利股份发布中期业绩。上半年,面对严峻复杂的市场环境,伊利直面挑战、主动调整,实现营业总收入599.15亿元,归母净利润75.31亿元,均稳居行业第一。

信息安全工程师模拟测试题

信息安全工程师:信息安全工程师证书属于软考中级资格证书之一,为了适应“十三五”期间计算机软件行业发展需要,满足社会多方对信息安全技术人员的迫切需求,信息安全工程师在2016年下半年首次开考,目前一年仅考一次。 信息安全工程师模拟测试题 一、基础知识二、软件应用 信息安全工程师 属于《国家职业资格目录(2021年版)》目录中的证书,通过考试将颁发由人社局和工信部盖章