逢宕机必谈起,多云是真火还是假热?

2023-12-17 22:20

本文主要是介绍逢宕机必谈起,多云是真火还是假热?,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

\n

每逢云平台发生宕机,多云这个话题都会被溜一遍,舆论之下的实际应用状况到底如何?多云到底是规避安全风险还是增加新的潜在危机?业内专家如何看待这一话题?

\n
\n

话题背景

\n

近两年,因为云计算的快速发展以及各大云厂商的几起宕机事故,将多云这一概念推向高潮,几乎每次宕机过后的接连几场云计算相关活动都会出现“多云”相关探讨。当然,这不代表本地自建机房时期的安全性有多高,只是云一旦出现问题,很容易产生共振效应,进而造成大范围影响。

\n

根据国外云计算的应用步伐来看,多云似乎已经被提上议程。前不久,分析公司 Kentik曾发布一份云相关的调查报告,该报告调查了 310 位技术和业务主管。令人寻味的是,AWS 和 Azure 似乎是两个最激烈的云竞争对手,但企业更倾向于同时部署两大云服务,也就是所谓的多云配对。

\n

调查显示多云部署正在快速发展,可能会逐渐超过混合云,并且最常见的云组合是 AWS 和 Azure,但也有客户选择 Google Cloud Platform。根据 Kentik 的调查,97%的受访者表示所在公司使用 AWS,35%的受访者表示也在积极使用 Azure,24% 的受访者同时使用 AWS 和 Google Cloud Platform。

\n

但是,也有不少用户发出质疑:单云都没用好,如何Hold住多云?作为云平台的直接使用者到底应该如何选择?InfoQ就此问题采访了数位业内专家、企业用户,并汇总了普通开发者的声音,我们来看看多云到底靠不靠谱。

\n

多云探讨

\n

在不少与宕机相关的文章中,都能看到与“多云”相关的评论,笔者随机截了几位相关评论,如下:
\n\"\"\"\"

\n

不难看出,大多数用户认为多云可以解决供应商锁定问题,并降低安全风险,因此推荐企业部署多云。对此,专家认为,避免厂商锁定是大多数企业的IT策略,其中一个重要考量是成本优化,大多数规模较大的企业都担心与云提供商建立单一供应关系,进而丧失议价能力,但多云是否会降低成本,需要看整体拥有成本的构成。当然,也有用户对多云提出质疑,认为如果上升到实践层面,不少企业恐怕无法应对成本、安全性、域名等相关政策带来的挑战。

\n

在知乎上,也有不少与多云相关的探讨:

\n

\"\"

\n

对此,业内专家在接受InfoQ采访时表示,作为云服务的采用者,企业首先需要仔细考虑清楚自己的战略,同时了解这些挑战最终可能带来的复杂性、成本和陷阱。在多云部署中,成本可能会成倍增加,这不仅仅是云订单的价格,还有运维成本。虽然一开始通过利用多个云计算提供商来实现成本效率似乎是合理的,但长远来看,缺乏工具和标准以及其他低效率培训和跟踪云平台使用的成本可能代价高昂。
\n 
\n目前,多云支持能力的供应商成熟度差异非常大。虽然一些供应商是早期采用者和开拓者,但彼此之间存在全方位差异,而这种差异使得采用过程非常复杂和低效。此外,从安全性和合规性角度来看,缺乏集成身份和访问管理也是一项重要挑战。

\n

Kubernetes将会促成多云?

\n

早前,InfoQ曾 对 Kubernetes 项目创始人兼 Heptio 首席执行官Craig McLuckie进行采访,其在采访中谈到:

\n
\n

Kubernetes 是一个非常健壮的真正的分布式系统。按照设计,它消除了系统中的单点故障。对于一个恰当配置的集群(配置了高可用及恰当的基础设施),你可以在数据中心里转转,拔掉节点,Kubernetes 会把工作负载调整到运行中的节点,把一切恢复到正常状态。许多用户在首次看到这个效果时都非常吃惊。我记得有人将其称为“猎枪证明系统(shotgun proof system)”。其稳定性令人吃惊。

\n
\n

确实,Kubernetes在云计算中处于一个恰好的位置,不是特别底层,不会让开发者受困于特定环境细节,而同时又可以获得足够的灵活性。关于这一点,其背后涉及更深层次的两个论题:一是为什么需要开放的云原生技术体系;二是如何在云端构建高可用IT架构保证业务的连续性。

\n

某互联网云计算厂商的技术专家表示,Kubernetes 一方面帮助用户屏蔽底层特定运行环境细节,一方面提供了灵活的资源调度和应用编排能力,可以让容器化应用获得足够的灵活性并简化自动化运维,得到了社区的广泛支持。CNCF推出Kubernetes一致性验证项目,各主流云厂商都通过了相关认证,保证了用户的容器化应用可以在不同云厂商之间平滑迁移。

\n

根据过去与客户的实际交流来看,尤其是金融、零售、制造、医疗卫生等领域,CIO们不希望被某一家厂商锁定,而是希望云提供商能够提供类似标准电力一样的计算能力,并尽可能价格优惠。云原生不断打磨标准,也必将使得企业用户会从在这个开放标准建立的过程中获益,获得基于云构建IT架构的最佳实践并可以选择合适迁云路径和云平台。

\n

至于第二个问题,用户上云需要一个E2E高可靠架构,比如云基础设施、应用基础设施、应用部署和应用架构自身。当然,这也需要综合考虑成本和效率。跨可用区可以实现同城容灾,而且可用区间延迟小(比如阿里云可用区之间延迟在几个毫秒以内),同时基础云产品基本全部做到了跨可用区容灾,用户使用这些能力提升架构可用性的成本很低。对于容灾能力要求更高的业务,业界比较通用的做法有两地三中心和异地多活等等,能做到地域级容灾能力。多云带来的收益是防止单个云产商多个地域同时出现问题,会更加复杂,这之间的网络互联性能、数据复制策略、管理成本都会非常高。
\n 
\n从Kubernetes的设计来说,其自身是一个健壮的分布式系统架构,如果集群采用了高可用配置,即使某个节点出现故障,原本运行在该节点的应用负载会被Kubernetes调整到其他运行良好的节点上。当然,这也并非高枕无忧。一个完整的高可用架构包括很多层面,从云基础设施IaaS、应用基础设施(如容器集群)配置,到应用配置(如K8s应用的跨AZ部署约束),再到应用架构自身配置,都息息相关。针对实际情况,可以实现不同级别的高可用,比如多可用区级别,或者跨区域、跨多个云供应商级别等。

\n

应用现状

\n

虽然多云目前备受关注,但就实际使用情况而言,国内在该领域仍处于初期阶段,新架构模式和实践经验还在探索之中,多云所带来的复杂性、潜在安全风险等问题都尚未有成熟的解决方案。
\n 
\n相比较而言,跨国企业和大型企业会更倾向于选择多云战略,这是受到安全合规和业务拓展等核心需求驱动。中小企业受限于成本和运维压力,轻易不会选择多云。一些海外500强企业进入中国,一般都会选择多云战略,这可以拓展地域覆盖并就近服务客户,因为云厂商覆盖的地域不同,企业为了业务拓展需要可能会选择多个云供应商。
\n 
\n企业在云迁移过程中所处的阶段和自身技术成熟度不尽相同,其中一些已经具备先进的能力,而其他企业才刚刚迈出试探性的脚步,业务需求和技术选型路径也会有所不同。
\n 
\n一般而言,传统企业会考虑将核心业务和数据放在私有云上,而把互联网应用等新兴业务部署在公有云上。随着业务的持续发展和IT架构的现代化改造,会逐渐扩大公有云比重将更多核心业务迁云,这个时间,企业往往会开始考虑多个云供应商的问题。
\n 
\n对于互联网企业,一开始就是在公有云环境下生长起来的。随着企业技术能力的成熟,整个IT架构充分利用了云能力,具备了较好的弹性、健壮性和可移植性。如果一个云供应商无法满足其业务拓展的需求,自然也会选择多个云供应商。
\n 
\n专家认为,用户对多云的关注,很大程度是云计算被普遍接纳的自然结果。但是,当下多云依然存在很大挑战,还需要业界一同努力。

\n

结语

\n

就现状而言,企业部署多云战略尤其是中小企业尚存难处。因此,企业不要盲目选择多云,首要应该保证单云架构下业务的安全稳定。虽然云计算比本地数据中心可用性高,但不能寄希望于云计算的可用性达到百分百,毕竟近两年主流云计算厂商皆发生过多起宕机事故。在发生可用区级别故障时,如果用户合理设置了多可用区支持可以应对故障。

\n

除了在架构上具备容灾能力,如何确保业务连续性也是一个重要话题。即便系统容灾能力建设完备,还需要确保能力符合预期,不能等真实故障来验证系统能力,容灾能力需要做好提前演练。在容灾能力之外,要真正做到业务高可用还有一系列工作,除了应对硬件设备灾难,还需要额外面对非常多其它挑战,比如流量冲击、引入不合理依赖、依赖环节不可用或者延迟高等,这些都是上云企业在互联网业务快速发展中需要考虑的问题。

\n

这篇关于逢宕机必谈起,多云是真火还是假热?的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/506070

相关文章

MySQL数据库宕机,启动不起来,教你一招搞定!

作者介绍:老苏,10余年DBA工作运维经验,擅长Oracle、MySQL、PG、Mongodb数据库运维(如安装迁移,性能优化、故障应急处理等)公众号:老苏畅谈运维欢迎关注本人公众号,更多精彩与您分享。 MySQL数据库宕机,数据页损坏问题,启动不起来,该如何排查和解决,本文将为你说明具体的排查过程。 查看MySQL error日志 查看 MySQL error日志,排查哪个表(表空间

多云架构下大模型训练的存储稳定性探索

一、多云架构与大模型训练的融合 (一)多云架构的优势与挑战 多云架构为大模型训练带来了诸多优势。首先,资源灵活性显著提高,不同的云平台可以提供不同类型的计算资源和存储服务,满足大模型训练在不同阶段的需求。例如,某些云平台可能在 GPU 计算资源上具有优势,而另一些则在存储成本或性能上表现出色,企业可以根据实际情况进行选择和组合。其次,扩展性得以增强,当大模型的规模不断扩大时,单一云平

使用Ansible进行多云环境的自动化部署与管理

使用Ansible进行多云环境的自动化部署与管理 引言 随着云计算技术的飞速发展,多云环境已经成为现代企业IT架构的主流选择。多云环境不仅提供了更高的灵活性和可用性,还能有效降低供应商锁定的风险。然而,多云环境的管理和部署复杂性也随之增加,传统的手动操作已经无法满足需求。Ansible作为一种简单而强大的自动化工具,可以帮助企业在多云环境中实现自动化部署和管理,显著提高效率并减少人为错误。

一次关于生产环境服务无故宕机的排查过程

故事的开始 这个故事是在一年之前,当时我们的系统运行在客户的k8s环境上。然后很神奇的是每个月底我们都会服务宕机,当然我们开启了多个实例。当时的容器线条就像心跳图一样(或许有些描述的不太准确,我没有找到当时那个像心电图一样的容器资源监控图)。 第一次的排查 当时我们还是很有信心去解决这个问题的。由于每个月的月底都是业务使用的高峰时段,也就是说,从表象上来看,qps一高,容器就挂。 业务日

如何进行不同数据库的集群操作?--从部署谈起,今天来看MySQL和NoSql数据库Redis的集群

篇幅较长,主要分为mysql和Redis两部分。找想要的部分可见目录食用。。 目录 什么是集群?为什么要集群? 1.1 数据库主要分为两大类:关系型数据库与 NoSQL 数据库 1.2 为什么还要用 NoSQL 数据库呢?                       -------------------华丽分割线-------------- 一、关系型数据库MySQL 1.部署

【技术警报】Redis故障启示录:当主节点宕机,如何避免数据“雪崩”?

在高并发的互联网世界中,Redis作为一个高性能的键值存储系统,常被用于缓存、消息队列等场景,为应用提速增效。然而,技术的光芒背后也隐藏着潜在的危机——今天,我们就来探讨一个真实发生的案例:Redis主节点意外宕机后,由于一系列配置与监控的疏漏,导致数据全部丢失,进而引发服务“雪崩”。这不仅是一个警示,更是一次深刻的技术反思。 事故背景 故事的主角是一个繁忙的在线服务平台,它依赖Redis处理

检查网站是否宕机PHP代码

<?phpfunction Networkcheck($url){$agent = "Mozilla/5.0 (Windows NT 6.1; WOW64; rv:42.0) Gecko/20100101 Firefox/42.0";//curl_init-初始化一个curl会话$ch=curl_init();//curl_setopt — 为一个curl设置会话参数curl_setopt ($

实现多云对象存储支持:Go 语言实践

实现多云对象存储支持:Go 语言实践 在现代云原生应用开发中,对象存储已成为不可或缺的组件。然而,不同的云服务提供商有各自的对象存储服务和 SDK。本文将介绍如何在 Go 语言中实现一个灵活的对象存储系统,支持多个主流云服务提供商,包括 AWS S3、Google Cloud Storage、MinIO 和阿里云 OSS。 目标 我们的目标是创建一个统一的接口,使得应用程序可以轻松地在不同的

Clobotics 计算机视觉场景存储实践:多云架构、 POSIX 全兼容、低运维的统一存储

Clobotics 是一家将计算机视觉和机器学习技术应用于风电以及零售行业的企业。在风电行业,Clobotics 利用无人机对风力发电机叶片进行检查,显著降低了对人工作业的依赖。在零售领域,公司通过分析捕获的包装商品图像来提供基于实时数据的洞察,以增加销售额并减少运营成本。 存储方面,Clobotics 原本直接使用云 SDK,而部分系统则使用了内部的封装器,没有形成统一的存储层,同时还面临多云

十大让服务器宕机的攻击方式及防御措施

服务器作为互联网基础设施的核心组成部分,其稳定性和安全性至关重要。然而,随着技术的发展,黑客们也在不断寻找新的方法来攻击服务器,导致其服务中断或完全崩溃。本文将介绍十种常见的让服务器宕机的攻击方式,并提供相应的防御建议。 1. DDoS 攻击 攻击方式 分布式拒绝服务(DDoS)攻击利用多台受感染的计算机作为“僵尸”或“机器人”主机,同时向目标服务器发送大量合法请求,耗尽服务器资源,使其无法