AWS和Azure频频中断,可靠性让公有云成为带刺的玫瑰

2024-03-01 15:18

本文主要是介绍AWS和Azure频频中断,可靠性让公有云成为带刺的玫瑰,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

为什么说公有云是带刺的玫瑰呢?我想这应该从公有云的价值和可靠性问题两方面来说。价廉,付费即用、弹性收缩,不用采购设备,不管运维,这就是公有云的价值,也是公有云发展的推动力;现在很多企业都把自己的业务系统搬到云上,当然大部分上云客户都是选择核心上私有云,边沿业务上公有云。最近AWS、Azure频频事故,可靠性、数据控制力和安全一次次给用户敲响警钟,下面我们来谈谈公有云的可靠性和用户应该如何应对。

说起公有云服务和市场,我们不得不提称霸整个公有云市场的龙头老大Amazon,它位于华盛顿州的西雅图。亚马逊成立于1995年,其云数据中心采用中心和边缘架构,28个中心云数据中心,52个边缘数据中心,目前向全球11个区域提供业务无差异体验的公有云服务

在云计算和公有云领域,Amazon很多服务都成了事实上的标准(主要包括S3和EC2),其云数据中心硬件设施(如数据机房、制冷、供电、存储、服务器、网络和监控等) 规范也被当做教科书被不同云服务厂商参考,AWS服务业务涵盖了整个IaaS、PaaS和SaaS层。

然而,从公有云出现到今天,市场的竞争局面虽未曾消减,但在激烈竞争和市场的洗礼之下,公有云的市场格局已日趋明显。引领整个公有云市场的依次是Amazon的AWS、微软的Azure、IBM的SoftLayer和Google的Cloud Platform,Oracle Cloud公有云服务业紧跟其后;阿里云也成为国内本土云服务领导者。公有云服务和技术发展和市场份额增加,也使得传统IT硬件厂商市场空间缩水。但是从目前来看公有云真的可靠吗,离我们所需的可靠还有多远路要走,包括成熟的公有云管理规范。

其实,公有云一直以来倍受争议和竞争激烈的市场,公有云服务厂商包括IaaS、PaaS和SaaS服务犹如雨后春笋,在市场格局还没有定格的情况下,客户对服务的选择也是一头雾水。

2013年由于公有云服务提供商Nirvanix在竞争中失利,强迫近1000家客户在短时间取回或迁移原来保存在Nirvanix云中的数据,Nirvanix突然停业给客户业务带来不小动荡和影响。

该说说公有云的可靠性了,我们就那老大Amazon来说,基本每年都有比较的可靠性事故发生。2017年3月,US-EAST-1地理区域的S3存储服务发生中断,依赖S3服务的Imgur、Medium和Docker Registry Hub,以及Runkeeper、Trello和雅虎网络邮箱等纷纷发生中断。

2016年3月云服务巨头亚马逊再一次发生了严重服务停机事故,前后维持了20分钟,将造成巨大经济损失。在事故发生时,亚马逊电子商务主网站无法访问,其他的服务业受到了波及,其中包括对外部服务的亚马逊云计算服务,以及面向包邮会员提供的音乐等数字内容服务。

2015年7月亚马逊Web服务(AWS)出现大规模宕机情况,导致Slack、Asana、Netflix、Pinterest等多款APP、以及多家使用AWS服务的网站出现无响应的情况。

2012年10月,亚马逊位于北弗吉尼亚数据中心的云计算平台再度宕机,导致多家知名网站长时间无法访问,知名网站和信息服务商也受到这次宕机的影响。这是过去一年半中亚马逊云计算的第五次宕机。

微软云Azure公有云服务在3月16日也发生服务中断,在全部28个数据中心中有26个受到影响。所影响区域的用户无法创建、更新和删除数据资源。但庆幸的是Azure云服务已恢复正常。2012年,Azure云服务也曾发生重大故障,当时持续了半天时间才恢复正常服务。

阿里云也是事故频频,2016年7月6号上午,蓝鲸TMT曝出消息称阿里云北京机房内网发生故障,近一个小时才恢复正常,导致大量互联网公司业务受到影响。阿里云的故障已有多次,2015年9月,阿里云由于客户正常文件被误隔离,导致所有基本命令都不能运行。2015年6月,阿里云在中国香港也发生超过12小时停止服务的事件。其实在此之前,阿里云发生过多起网络故障问题。

种种停机事和服务中断故说明,现阶段共有云在可靠性上存在很大问题,当然用户和服务商不能回避云计算自身的问题,不能因为一次故障就全盘否认;但也不应该过渡追捧云计算。为了使公有云能更好服务大众,共有云服务商可以考虑从技术手段做出改进,用户也要重新审视什么样的业务才适合共有云

对云服务提供商来说,除了要考虑数据备份、容灾,针对不同业务提供不同等级服务外,也要考虑重大灾难或停止服务时,提供有效的数据应急手段,确保客户能取回或迁移重要的数据。通过安全技术保证数据被泄漏的风险。通过提供专业服务能力,制定数据回迁策略和优先级。

此外,还要考虑如何短期内给客户找一个数据新家(新云服务提供商)来存储、保护这些云上数据;这也就要求云服务提供商首先是比较开放的,可以实现跨云数据共享和数据迁移。

对企业和组织客户来说,在向公有云上部署业务、购买云服务时不能只依赖于一个服务商,需要介入多个云来实现更好的灵活性;确保数据在多个地区有多个副本,在保证数据可靠性的同时,享受数据本地化访问的性能优势;建议数据通过混合云的方式连接公有云,公有云只作为备份或非关键业务。

公有云服务对企业、组织用户来说确实是个好事物,它既能提供廉价、免运维的低成本投入,也能按需投入、按需分配满足不同业务要求。但凡是都有两面性、公有云也是一把双刃剑。要更好的使用公有云服务,那对客户和云服务厂商都比要承担自己的责任和义务。更多精彩内容请搜索关注“架构师技术联盟”微信公众号。

这篇关于AWS和Azure频频中断,可靠性让公有云成为带刺的玫瑰的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/762896

相关文章

第10章 中断和动态时钟显示

第10章 中断和动态时钟显示 从本章开始,按照书籍的划分,第10章开始就进入保护模式(Protected Mode)部分了,感觉从这里开始难度突然就增加了。 书中介绍了为什么有中断(Interrupt)的设计,中断的几种方式:外部硬件中断、内部中断和软中断。通过中断做了一个会走的时钟和屏幕上输入字符的程序。 我自己理解中断的一些作用: 为了更好的利用处理器的性能。协同快速和慢速设备一起工作

高效+灵活,万博智云全球发布AWS无代理跨云容灾方案!

摘要 近日,万博智云推出了基于AWS的无代理跨云容灾解决方案,并与拉丁美洲,中东,亚洲的合作伙伴面向全球开展了联合发布。这一方案以AWS应用环境为基础,将HyperBDR平台的高效、灵活和成本效益优势与无代理功能相结合,为全球企业带来实现了更便捷、经济的数据保护。 一、全球联合发布 9月2日,万博智云CEO Michael Wong在线上平台发布AWS无代理跨云容灾解决方案的阐述视频,介绍了

FreeRTOS学习笔记(四)Freertos的中断管理及临界保护

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 前言一、Cortex-M 中断管理1.1 中断优先级分组1.2 相关寄存器1.3 相关宏定义1.4 FreeRTOS 开关中断 二、临界段及其保护2.1 taskENTER_CRITICAL( ) 和 taskEXIT_CRITICAL( )2.2 taskENTER_CRITICAL_FROM_ISR( )

如何成为一个优秀的测试工程师

链接地址:http://blog.csdn.net/KerryZhu/article/details/5250504 我一直在想,如何将自己的测试团队打造成世界一流的团队?流程、测试自动化、创新、扁平式管理、国际标准制定、测试社区贡献、…… 但首先一点是明确的,就是要将每一个测试工程师打造成优秀的测试工程师,优秀的团队必须由优秀的成员构成。所以,先讨论“如何成为一个优秀的测试工程师”,

Cortex-A7:ARM官方推荐的嵌套中断实现机制

0 参考资料 ARM Cortex-A(armV7)编程手册V4.0.pdf ARM体系结构与编程第2版 1 前言 Cortex-M系列内核MCU中断硬件原生支持嵌套中断,开发者不需要为了实现嵌套中断而进行额外的工作。但在Cortex-A7中,硬件原生是不支持嵌套中断的,这从Cortex-A7中断向量表中仅为外部中断设置了一个中断向量可以看出。本文介绍ARM官方推荐使用的嵌套中断实现机

使用Azure Devops Pipeline将Docker应用部署到你的Raspberry Pi上

文章目录 1. 添加树莓派到 Agent Pool1.1 添加pool1.2 添加agent 2. 将树莓派添加到 Deployment Pool2.1 添加pool2.2 添加target 3. 添加编译流水线3.1 添加编译命令3.2 配置触发器 4. 添加发布流水线4.1 添加命令行4.2 配置artifact和触发器 5. 完成 1. 添加树莓派到 Agent Pool

外部中断的边缘触发和电平触发

MCS-51单片机中的边缘触发是指当输入引脚电平由高到低发生跳变时,才引起中断。而电平触发是指只要外部引脚为低电平就引起中断。         在电平触发方式下,当外部引脚的低电平在中断服务返回前没有被拉高时(即撤除中断请求状态),会引起反复的不需要的中断,造成程序执行的错误。这类中断方式下,需要在中断服务程序中设置指令,清除外部中断的低电平状态,使之变为高电平。

HTML5如何成为改变移动互联网幕后的推手

在未来的某一天,我们打开手机,不再需要访问手机应用商店,不论是 Apple的还是Google的,我们只需要点击手机主菜单页面上的一个链接,手机就会立即在它的浏览器上启动一个 “应用程序”;再也不需要flash插件,就能欣赏华丽丽视频画面。   AD:2013云计算架构师峰会课程资料下载   2012年,说HTML5集千宠万爱于一身也毫不夸张,IE、Chrome、Firefox和Opera等

【Java编程思想】线程的基本协作机制 与 线程的中断

wait/notify Java在Object类中定义了一些线程协作的基本方法,wait和notify public final void wait() throws InterruptedException;public final native void wait(long timeout) throws InterruptedException; 一个带时间参数,单位是毫秒,表示最

基于IMX6ULL的Cortex-A中断原理讲解,以及编写其中断向量表

首先借助STM32我们需要了解中断系统是如何构成的         会有一个中断源,也就是能够向CPU发出中断请求的设备或事件。中断源不分硬件和软件,也就是产生中断信号,就会执行中断服务函数         但是CPU是如何知道中断源产生后就找到对应的中断服务函数呢,这个时候就要引入中断向量表,它的主要功能是描述中断对应的中断服务函数,每个中断源都有一个唯一的中断号(也称向量号),