双11阿里云技术负责人杨旭:大考亦从容

2024-03-26 23:30

本文主要是介绍双11阿里云技术负责人杨旭:大考亦从容,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

杨旭,花名杨曦,这是他的第六个双11。

从2012年开始,阿里云通过云计算技术为天猫双11提供计算服务

3年前杨旭开始作为双11阿里云技术负责人,负责搭建全球最大的混合云结构,把 “11”的电商业务和技术场景在阿里云上实现,并保障这个混合云在双11当天能满足全球客户的购物需求。 

11月11日晚上零点整,海量峰值如期而至,项目室里的每一个人都屏息静气的看着陡增的峰值。

几个小时以后,第一波峰值顺利度过,项目室里又恢复了喧闹。 

“每一年的双11,都是一次赶考。”杨旭一边喝可乐,一边与记者聊了起来。

72acaddbdf84a4fd00af0698bfef7c46de973011

杨曦

充分准备是成功的关键

阿里云的技术支持,早在一年前就开始准备了。去年12月中旬左右,杨旭就筹备召开了阿里巴巴的2017的双11策划会,制定了工作目标,详细每个单元的产品技术方案验证。通过多次测试以及全链路的压测,确保所有的方案和实施都能满足双11的业务需要。

在杨旭看来,这其中的每一项工作关系到今年11的阿里云表现每一项工作都是一道考题。“特别下半年压测的时候,只有那么几次机会,如果不成功可能要影响整个双11项目结果,压力大的时候,经常半夜睡不着觉,梦里都在记录解决方案。”

有一次遇到一个业务问题没解决,担心影响到双11的交易成功率,整个团队基本一个星期通宵处理问题,优化升级系统。杨旭说,为了支持这个项目,团队很多同事也都牺牲很大。压测期间,网络业务线抽调的一位同事整整48小时没有睡觉解决完问题回家,才想起2天前准备给妻子过生日的蛋糕还藏在卧室的衣柜里,打开柜门一看,蛋糕早已融化。有时候问题紧急,常常相关业务的同事半夜从家里来现场支持。“阿里云的双11团队,这是一只铁军”,杨旭感慨的说。

从2012年的最小单元验证开始,阿里云不断迭代优化,2017年,已经成长为“应用+存储+缓存+数据库+网络”的全业务上云的混合云解决方案,可以有效应对处理双11这样的脉冲计算

 1d629e1fcd946898213a33cb7a3f1dcfb49bd371

云化架构使多个数据中心像一台计算机一样来管理,可以跨多个不同的平台来调度业务发展所需的资源,构建混合云以极低成本拿到服务器,通过混合部署大幅提升资源利用率,支撑系统容量。在今年双11,阿里交易峰值再创新高达到32.5W笔/秒,这背后是靠云化架构在支撑,得以真正实现弹性资源平滑复用、任务灵活混合部署。

有了阿里云的保驾护航,杨旭表示,距离11的成功更近了一步 

谈笑间方显大将风范

早在今年9月底,杨旭就带领队伍进了阿里巴巴西溪园区的作战室。11月9日晚上20点,在1号楼阿里云的双11项目正式拉开帷幕。 

顶层的作战室里,杨旭带领着这个位于全球各地,共百余人的队伍,在双11的24小时保障视频云、图片云、电商云、金融云、物流云的正常运转 

累了,团队的同事就找个凳子,或者按摩椅睡上1-2小时,这个时候,业务部门的就会负责这块工作的其他同事顶上,保证双11期间阿里云上所有业务都有人实时盯守。 

“所有人都有人轮换,只有我是10号晚上八点进去,11号凌晨才能出来。”杨旭笑着告诉记者。“这不仅仅是阿里云的项目,更是阿里巴巴项目全国人民,甚至全球人民狂欢购物节,不能出一点差错。”。 

阿里云的能力虽然让杨旭信心十足,但今年的大考,又比往年更不容易。 

零点将至,虽然有些疲惫,但杨旭似乎越来越有信心,甚至成为了项目室情绪的调动者。

“大家11的购物车都满了吗?”杨旭的这个问题,让项目室里七嘴八舌起来。

一切似乎尽在掌握中,直到零点将至,氛围开始变得严肃起来。 

零点时分,大促正式开始,不断的有人在小声报出各个指标。 

“水位正常!”

“资源正常!”

“核心链路畅通!” 

这是最紧张的时刻,然而杨旭告诉记者。

“养兵千日,用兵一时,这个时候我是最放心的人。” 

2017年天猫双11购物狂欢节开场仅11秒交易就额破亿,3分钟突破100亿,6分钟超200亿,24小时后成交额定格于1682亿元。今年交易峰值32.5万/秒,支付峰值25.6万/秒,比去年增长超1.1倍,再次刷新全球纪录。

 e5a82215cc49318751bb24d374afbc7fe580a7da

 脉冲计算

在持续高压力冲击下,整个双11期间阿里云表现坚如磐石,各项技术指标也再次刷新世界纪录。直播支撑了4000万用户观看晚会,CDN提供80T的访问加速带宽,混合云提供了将近100万弹性计算资源调度,存储提供了340P的图片存储和2.3万亿文件,物流云全天支撑订单流转8亿+,ApsaraDB数据库最高QPS达到554万HTTPDNS在承载上千亿次日解析量的同时保持了平均10ms以下的低响应延迟……

这一串串华丽数字的背后,作为整个天猫商家的基石,阿里云是如何保障在零点洪峰来临时候稳定、安全和顺畅?

杨旭认为,优秀的产品和技术是阿里云制胜的法宝,举几个例子

直播技术:窄带高清2.0技术,用户观看质量上以360P带宽可以达到480P清晰度,480P带宽可以达到720P清晰度,同样清晰度下带宽节约30%,H.265相当比H.264为用户节约30%带宽。

计算能力:通过对虚拟化技术的优化,让极限情况下虚拟机的计算能力和物理机保持一致后续阿里云将进一步挖掘产品的计算能力。阿里云还推出了神龙服务器,通过异构计算彻底将虚拟化损耗降为0。

实例存储:通过结合SPDK+DPDK减少IO访问路径,可以将单机的IOPS提高到210w,满足大计算、重IO的高端用户场景。

CloudDBA产品:通过自动化,自助化小白诊断,实现物流云等商家的全覆盖,实现事务分析,TOP SQL,SQL Review,死锁分析等全场景自动化,无论是给客户,还是给阿里云自己都节约成本,提升用户体验。

大数据:线下推出感知零售产品,通过数据化向智能化的转变,让数据也有情感,提升新零售的转化率。

用最好的技术回馈社会

阿里云的技术每年都在突飞猛进的发展,即便作为一名资深技术人员,杨旭每年也会被新的技术、新的产品所深深震惊,比如今年双11阿里云部署网络产品,使用规模非常大,对性能的支持力度很大,这在全球也是领先的水平。

“马总说过双11是锻炼技术的。我们云上的技术方案,新技术的尝试,新的产品都会先自己验证,然后再给客户用。特别是通过全球唯一双11这种极端环境对新技术压测,还有每年多次大型活动和项目的锤炼我们的产品和技术都有最好的保证然后我们会沉淀下来,放在公有云上再提供给客户使用” 杨旭时刻谨记,阿里巴巴客户永远是第一位的。 

阿里云双11混合云架构,是全球最大的混合云架构,具备极致的弹性调度管控能力,杨旭认为,这套成功的经验可以快速满足公司国际化战略对全球资源部署的调度。 

在杨旭看来云计算不是简单的物理机虚拟化,更是一种计算和服务能力的体现,目前云上的产品大多是阿里云内部精华技术的沉淀,希望大家以一种开放的心态来用拥抱云计算,大胆尝试使用新技术,一定有意想不到的收获

正是因为每个团队在这几个月里默默的努力和不放过每一个细节,才让今年双11变成史上最轻松的双11。 

“我们不仅完美的支撑的阿里巴巴的主战场,也可以骄傲的说我们用最完美的技术支撑了全社会的狂欢,我们阿里云客户的狂欢!今年的双11,非常完美”。在11月12日凌晨2点的阿里巴巴西溪园区,连续值守52小时后杨旭顺利完成了今年双11混合云的接入和保障任务,他揉着双眼,轻松地笑着说 

技术扩展着商业的边界,商业的效率,创造着生活的美好前行,双11的技术能力,终将化为未来社会的常态。以阿里云为代表的云计算行业,也已是社会的基础设施,正如所有的超级工程一样,一个个工程师们的努力,将异想天开的想象力变成了现实。这样的故事在过去的一百年,两百年,一千年,两千年间不断发生,才让人类得以创造出任何生命都未曾创造出的奇迹,这个奇迹被人们称为:文明。

这篇关于双11阿里云技术负责人杨旭:大考亦从容的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/850213

相关文章

阿里开源语音识别SenseVoiceWindows环境部署

SenseVoice介绍 SenseVoice 专注于高精度多语言语音识别、情感辨识和音频事件检测多语言识别: 采用超过 40 万小时数据训练,支持超过 50 种语言,识别效果上优于 Whisper 模型。富文本识别:具备优秀的情感识别,能够在测试数据上达到和超过目前最佳情感识别模型的效果。支持声音事件检测能力,支持音乐、掌声、笑声、哭声、咳嗽、喷嚏等多种常见人机交互事件进行检测。高效推

【专题】2024飞行汽车技术全景报告合集PDF分享(附原数据表)

原文链接: https://tecdat.cn/?p=37628 6月16日,小鹏汇天旅航者X2在北京大兴国际机场临空经济区完成首飞,这也是小鹏汇天的产品在京津冀地区进行的首次飞行。小鹏汇天方面还表示,公司准备量产,并计划今年四季度开启预售小鹏汇天分体式飞行汽车,探索分体式飞行汽车城际通勤。阅读原文,获取专题报告合集全文,解锁文末271份飞行汽车相关行业研究报告。 据悉,业内人士对飞行汽车行业

金融业开源技术 术语

金融业开源技术  术语 1  范围 本文件界定了金融业开源技术的常用术语。 本文件适用于金融业中涉及开源技术的相关标准及规范性文件制定和信息沟通等活动。

AI(文生语音)-TTS 技术线路探索学习:从拼接式参数化方法到Tacotron端到端输出

AI(文生语音)-TTS 技术线路探索学习:从拼接式参数化方法到Tacotron端到端输出 在数字化时代,文本到语音(Text-to-Speech, TTS)技术已成为人机交互的关键桥梁,无论是为视障人士提供辅助阅读,还是为智能助手注入声音的灵魂,TTS 技术都扮演着至关重要的角色。从最初的拼接式方法到参数化技术,再到现今的深度学习解决方案,TTS 技术经历了一段长足的进步。这篇文章将带您穿越时

系统架构设计师: 信息安全技术

简简单单 Online zuozuo: 简简单单 Online zuozuo 简简单单 Online zuozuo 简简单单 Online zuozuo 简简单单 Online zuozuo :本心、输入输出、结果 简简单单 Online zuozuo : 文章目录 系统架构设计师: 信息安全技术前言信息安全的基本要素:信息安全的范围:安全措施的目标:访问控制技术要素:访问控制包括:等保

前端技术(七)——less 教程

一、less简介 1. less是什么? less是一种动态样式语言,属于css预处理器的范畴,它扩展了CSS语言,增加了变量、Mixin、函数等特性,使CSS 更易维护和扩展LESS 既可以在 客户端 上运行 ,也可以借助Node.js在服务端运行。 less的中文官网:https://lesscss.cn/ 2. less编译工具 koala 官网 http://koala-app.

Spring的设计⽬标——《Spring技术内幕》

读《Spring技术内幕》第二版,计文柯著。 如果我们要简要地描述Spring的设计⽬标,可以这么说,Spring为开发者提供的是⼀个⼀站式的轻量级应⽤开发框架(平台)。 作为平台,Spring抽象了我们在 许多应⽤开发中遇到的共性问题;同时,作为⼀个轻量级的应⽤开发框架,Spring和传统的J2EE开发相⽐,有其⾃⾝的特点。 通过这些⾃⾝的特点,Spring充分体现了它的设计理念:在

java线程深度解析(六)——线程池技术

http://blog.csdn.net/Daybreak1209/article/details/51382604 一种最为简单的线程创建和回收的方法: [html]  view plain copy new Thread(new Runnable(){                @Override               public voi

java线程深度解析(二)——线程互斥技术与线程间通信

http://blog.csdn.net/daybreak1209/article/details/51307679      在java多线程——线程同步问题中,对于多线程下程序启动时出现的线程安全问题的背景和初步解决方案已经有了详细的介绍。本文将再度深入解析对线程代码块和方法的同步控制和多线程间通信的实例。 一、再现多线程下安全问题 先看开启两条线程,分别按序打印字符串的

SSM项目使用AOP技术进行日志记录

本步骤只记录完成切面所需的必要代码 本人开发中遇到的问题: 切面一直切不进去,最后发现需要在springMVC的核心配置文件中中开启注解驱动才可以,只在spring的核心配置文件中开启是不会在web项目中生效的。 之后按照下面的代码进行配置,然后前端在访问controller层中的路径时即可观察到日志已经被正常记录到数据库,代码中有部分注释,看不懂的可以参照注释。接下来进入正题 1、导入m