历经三年磨砺,快手交换机的自研创新之路

2024-09-04 14:52

本文主要是介绍历经三年磨砺,快手交换机的自研创新之路,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

导读:

快手自研交换机是2021年初开始立项,坚持软件自主可控 / 硬件生态开放的整体战略,历经三年磨砺,发布扛鼎之作『快手自研51.2T交换机』,是首家引入多元化交换芯片并在数据中心网络中规模化部署!更是首家采用国产化交换芯片并规模部署落地!

开放多元化,助力行业生态健康发展

交换机作为数据中心网络架构的基石,肩负着数据传输、设备互联等关键职责,其重要性不言而喻。2021年初,彼时行业已是一片红海,高手云集,多家厂商深耕多年。快手毅然决然地踏上了自研交换机的征途,以『软件自主可控 / 硬件生态开放』的技术战略,开启了一场技术“变革”。

秉持着“硬件生态开放”的理念,快手自研交换机从网络交换芯片到整机设备,全面推动硬件层面的多元化与开放,成为行业“破冰者”,快手率先实施交换机芯片的多元化战略,打破垄断,为行业生态注入新活力。同时,依托“软件自主可控”的关键策略,快手积极拥抱开源社区,以SONiC为基础构建了一个开放架构的网络操作系统平台 KNOS(Kuaishou Network Operating System),见下图:

在开放架构能力的加持下,快手逐步构建了深度合作的研发生态,携手芯片厂商及硬件整机厂商,加速硬件适配与产品落地,为持续创新奠定坚实基础。回望三年多的发展历程,快手实现了从零到一的飞跃,构建起了一个全面开放的多元化系统平台。在此过程中不断优化与拓展,逐步完善了对各类网络场景的全方位支撑能力。从最初的2T/12.8T起步,稳步发展至8T/25.6T,直至最新发布的51.2T交换机,实现了自研交换机对网络全场景的覆盖。快手以行动诠释多元化战略,不仅是首家引入多元化交换芯片并在数据中心网络中规模化部署!更是首家采用国产化交换芯片并规模部署落地!以实际行动助推国产网络交换芯片技术的飞速发展。


51.2T交换机规模落地,牵引新一代网络架构技术演进

自2022年初,快手基础设施团队便投身于51.2T交换芯片的网络架构和交换机产品设计,凭借对业务场景需求的精准洞察及网络架构未来发展的深思熟虑,快手设计出了一款集硬核科技与实用性于一身的自研交换机——它以4RU的紧凑高度,搭载了128个400G QSFP112端口,旨在为快手下一代网络架构提供全面而强大的产品解决方案。

快手自研交换机采用51.2T多元化芯片,中心交换、接口单元、主控单元等均采用模块化设计,模块间采用高速SLIMSAS总线互联,可靠性高。支持高密度128个QSFP112的400G端口,带宽高达51.2T,支持400 ZR/ZR+ ,支持200G和100G扇出。创新式两层PCB板设计,节省了一块高速PCB板材和装配,双层固定扣板结构,连接可靠,保障112G速率信号的稳定传输。主控单元,CPU模组设计采用OCM标准,支持BMC进行外设管理。盒体前面板可拆卸,支持多元化交换芯片和接口板,支持不同端口形态的机型。

快手自研51.2T交换机

在软件方面,快手依托KNOS这一自主可控的研发平台,在常规数据中心网络的功能特性基础上,针对快手特有的网络场景的部署特点,创新性地引入了RDMA/PFC/ECN/BufferQueue、UCMP、BFD/Link-Delay、ISIS、ZR等一系列新技术特性。这些新技术的融入,使得快手自研交换机全面覆盖DCN数据中心网络、HPN高性能智算网络、DCI城域网、KBN骨干网、CDN等主要网络场景,极大地提升了网络运营效率与稳定性保障能力。通过高效的自动化管控技术与精细化的监控手段,快手正引领着数据中心网络向更加智能化、高效化的未来迈进。

具体技术亮点包括:

  • RDMA:利用KNOS中的RDMA相关特性,与统一网络管控平台KNP紧密协作,构建了一套集功能支撑、精细化白盒监控、带内遥测可视化、自动化管控调度、流量调优等于一体的端到端高性能网络解决方案,有效削减CPU负载和内存带宽消耗,全方位提升系统性能。

  • UCMP(Unequal Cost Multiple Path):创新采用了UCMP协议及动态负载分担功能,根据实时可用带宽比例智能调整流量分配,有效缓解链路故障下的拥塞丢包问题,增强了网络的稳定性和灵活性,使自研交换机能在更多复杂网络场景中成功部署与应用。

  • 无损热升级:自研KNOS系统通过无损热补丁设计技术,实现了对交换机软件的快速、无损升级,覆盖了全场景运维需求,确保在业务无感知的情况下完成软件修正与功能增强。

  • 网络丢包检测(MOD):快手自研了MOD(Mirror On Drop)功能,该功能能实时捕捉并分析芯片层面各类常见丢包事件,精准记录丢包原因及被丢弃报文的关键特征,随后将这些宝贵信息传输至采集器。极大缩减故障排查时间,为数据中心网络的稳定运行提供了坚不可摧的保障。

  • 网络可视化/带内遥测(INT):集成先进的带内遥测(INT)技术,快手交换机在数据包流转间巧妙嵌入核心运行数据,实现状态与数据的同步传递。沿途设备接力标注,最终汇聚至监控分析中心,通过深度数据挖掘与拓扑融合,为运维人员呈现报文全路径视图与端到端时延细节,助力网络性能优化决策更加精准。

基于自研 51.2T 交换机,快手构建了 全新一代数据中心网络架构,单个网络集群即可轻松驾驭30万台100G服务器的接入需求,其容量之巨,较上一代产品实现了质的飞跃,同时前瞻性地兼容了未来200G/400G服务器的接入,在成本与性能和方面具备显著优势,确保了技术投资的长期价值。

快手自研51.2T交换机不仅是常规数据中心网络场景下的理想选择,更在AI算力集群中扮演了核心枢纽的角色。通过深度整合RoCEv2端到端解决方案,快手成功构建了万卡级大模型集群网络,更率先在国内行业里实现了400G RoCEv2高性能网络的部署应用!这一举措不仅与业界传统IB网络方案在性能上并驾齐驱,更实现了成本的大幅削减,降幅超过80%。

超大规模数据中心网络

万卡级大模型网络集群

全自研 & 全链路协同解决方案,极致的性能与成本

随着自研51.2T交换机的规模化成功部署,快手已构建起覆盖全网络场景的交换机产品矩阵,从早期的2T/12.8T、8T到如今的旗舰级51.2T,全面实现了从25G到400G服务器接入的交换机自研闭环。

交换机全自研化的进程,如同引擎般驱动了与交换机紧密相关的关联产品(如光模块等)的定制化与多元化发展。快手以此为核心,精心打造全链路解决方案,通过无缝集成的软硬件生态,实现网络性能的极致优化与TCO(总体拥有成本)的显著降低。值得一提的是,快手在业界率先推出并批量部署了400G QSFP112硅光方案模块,该模块不仅代表了当前高速数据传输技术的顶尖水平,更融入了快手对网络性能的深刻理解与独特优化,为快手数据中心及跨数据中心互联提供了更快速度与更好的灵活性。

快手400G QSFP112硅光模块

自研51.2T交换机在快手跨数据中心网络互联中的创新应用,通过支持400G ZR彩光模块,该交换机能够直接与对端光层传输设备相连,实现IPoDWDM(IP over Dense Wavelength Division Multiplexing)技术方案。这一创新不仅省去了传统传输系统中的电层设备和客户侧灰光模块,简化了网络结构,更在提升数据传输效率的同时,实现了网络建设成本的显著降低。

软件系统闭环,高效的自动化管控及精细化监控能力

随着交换机实现全部自研,快手不仅构建了开放架构的网络操作系统平台 KNOS,还自主研发了KNP统一网络管控平台,二者相辅相成共同实现了端到端软件系统闭环的自主可控能力。在网络管控自动化的实现方式上,快手摒弃了传统的命令行(CLI)配置模式,转而拥抱标准化Rpc/Api接口与结构化数据建模。这一转变,如同从手工编织转向精密机械生产,将原本基于文本的分散式人工配置,华丽蜕变为API/数据建模驱动的程序化编程,极大地提升了网络管控的自动化效率与精准度。

同时,在网络监控可视化领域,快手也实现了对传统SNMP等数据采集方式的超越,转而采用按需定制化、高精度数据采集方案,并依托高效的RPC通讯机制与平台无缝对接,让监控可视化不再是简单的数据堆砌,而是成为端到端精细化、白盒化洞察网络运行状态的利器,为快手网络的稳定运行与持续优化提供了坚实的支撑。

得益于自动化管控与精细化监控能力,快手能够轻松驾驭各种定制化、专有的端到端运维管控能力,如零接触配置、无损升级、自动化变更、丢包检测、带内遥测、故障自愈等,这些功能如今已如臂使指,为快手网络的智能化运维插上了翅膀。

更值得一提的是,针对快手独特的网络场景需求,KNOS与KNP携手共进,快速迭代开发出一系列定制化功能,在网络建设交付、自动化运维管控、版本维护管理以及问题隐患快速修复等方面实现了多项技术创新。这些成果不仅极大地提升了快手网络运营效率,更为其业务的快速发展提供了强有力的网络保障。

未来展望

快手自研交换机历经三年的稳健发展,不仅在新技术新产品的研发与落地方面取得了令人瞩目的成就,同时在行业生态合作领域也构建了坚实的基石。展望未来,快手将在这两大维度上持续深耕,加速前行。

在新技术新产品引入方面,依托自主研发与快速迭代能力,通过不断引入更高性能的芯片,持续推动自研交换机向更大带宽、更高容量的极限挑战。同时,快手将积极探索INT/SDN、端网融合、在网计算等前沿技术,力求在自主研发的道路上不断突破,满足新一代AI/大模型算力网络及大规模数据中心网络对极致带宽与超低延时的迫切需求,为数字经济时代的快速发展提供强大的网络支撑。

在坚持软硬件解耦、硬件开放的战略指引下,快手将进一步加强与全球芯片及ODM供应商的合作伙伴关系,建立更加广泛而深入的研发合作机制。通过资源共享、优势互补,共同推动网络技术的创新与进步。在未来的征途中,快手将与合作伙伴们并肩作战,共创网络技术的崭新篇章。

本文作者:陈平平

这篇关于历经三年磨砺,快手交换机的自研创新之路的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1136289

相关文章

计算机网络基础概念 交换机、路由器、网关、TBOX

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 前言一、VLAN是什么?二 、交换机三、路由器四、网关五、TBOXTelematics BOX,简称车载T-BOX,车联网系统包含四部分,主机、车载T-BOX、手机APP及后台系统。主机主要用于车内的影音娱乐,以及车辆信息显示;车载T-BOX主要用于和后台系统/手机APP通信,实现手机APP的车辆信息显示与控

风格控制水平创新高!南理工InstantX小红书发布CSGO:简单高效的端到端风格迁移框架

论文链接:https://arxiv.org/pdf/2408.16766 项目链接:https://csgo-gen.github.io/ 亮点直击 构建了一个专门用于风格迁移的数据集设计了一个简单但有效的端到端训练的风格迁移框架CSGO框架,以验证这个大规模数据集在风格迁移中的有益效果。引入了内容对齐评分(Content Alignment Score,简称CAS)来评估风格迁移

深入RabbitMQ世界:探索3种队列、4种交换机、7大工作模式及常见概念

文章目录 文章导图RabbitMQ架构及相关概念四大核心概念名词解读 七大工作模式及四大交换机类型0、前置了解-默认交换机DirectExchange1、简单模式(Simple Queue)-默认DirectExchange2、 工作队列模式(Work Queues)-默认DirectExchange3、发布/订阅模式(Publish/Subscribe)-FanoutExchange4、路

2024年AI芯片峰会——AI芯片架构创新专场

概述 2024年9月7日于北京举行。 官方链接: 大会官网 正文 对存内计算的思考——戴瑾 面向边缘端大语言模型的RPP架构芯片与落地实践——李原 LLM推理端的特征 边缘计算的特征 来源《联想集团边缘计算白皮书》出炉 Llama2计算过程举例 RPP架构 RPP软件栈 RPP的PPA AI 芯片架构创新开启打算里第二增长曲

【ShuQiHere】从残差思想到 ResNet:深度学习的突破性创新

【ShuQiHere】引言 在深度学习的迅速发展中,卷积神经网络(CNN)凭借其在计算机视觉领域的出色表现,已经成为一种主流的神经网络架构。然而,随着网络层数的增加,研究人员逐渐发现了一个关键问题:梯度消失 😖 和 梯度爆炸 💥,这使得训练非常深的网络变得极其困难。为了解决这一问题,残差思想 💡 被提出,并在 2015 年由 Kaiming He 等人正式引入 ResNet 中。这一创新不

联众优车持续加大汽车金融服务投入与创新,赋能汽车消费新生态

近年来,中国汽车消费市场呈现出蓬勃发展的态势,而汽车金融服务作为降低购车门槛、优化购车体验的重要手段,正日益受到市场的青睐。《2023中国汽车消费趋势调查报告》显示,相较于前一年,今年选择汽车金融服务的市场消费者占比显著提升,其中潜在购车者占比高达67.8%,再购用户及现有用户占比也分别达到59.9%和49.4%。在这一背景下,作为汽车综合服务市场的领军企业,联众优车持续加大在汽车金融服务领域的投

百度智能云向量数据库创新和应用实践分享

本文整理自第 15 届中国数据库技术大会 DTCC 2024 演讲《百度智能云向量数据库创新和应用实践分享》 在 IT 行业,数据库有超过 70 年的历史了。对于快速发展的 IT 行业来说,一个超过 70 年历史的技术,感觉像恐龙一样,非常稀有和少见。 但是数据库之所以有这么长的生命力,核心是在不停的变更和创新。 简单回顾一下数据库的历史,在过去的 70 年里面,数据库一直跟着底层基础设

小琳AI课堂:大模型的发展历程:从创新到挑战

大家好,这里是小琳AI课堂。今天我们来聊聊大模型的发展历程,这是一段充满创新与挑战的故事。🚀 让我们追溯到20世纪50年代,那时计算机科学和人工智能还处于萌芽阶段。 早期探索(1950s-1970s) 早期探索是大模型发展历程中的一个关键时期,它标志着人工智能作为一门学科的诞生。这个时期,计算机科学和人工智能还处于起步阶段,科学家们充满好奇地探索如何让机器模仿人类智能。这一阶段的探索不仅奠定

计算机三级网络技术总结 第六章交换机及其配置

采用直通交换模式的交换机开始转发数据帧时已经接收到的帧长度时14字节建立VALN的命令格式: vlan <vlan_ID> name <vlan_name> 为端口分配VLAN的命令格式为: switchport access vlan <vlan_num>  不给定名字的VLAN,系统自动按缺省的VLAN名(VLAN00xxx)配置交换机Catalyst 6500管理IP地址命令格式: (ena

网页时装购物系统:Spring Boot框架的创新设计

第1章 绪论 1.1背景及意义 随着社会的快速发展,计算机的影响是全面且深入的。人们生活水平的不断提高,日常生活中人们对时装购物系统方面的要求也在不断提高,喜欢购物的人数更是不断增加,使得时装购物系统的开发成为必需而且紧迫的事情。时装购物系统主要是借助计算机,通过对时装购物系统所需的信息管理,增加用户的选择,同时也方便对广大时装购物系统的及时查询、修改以及对时装购物系统的及时了解。时装购物系统对用