UEC(Ultra-Ethernet-consortium)新技术联盟,磨刀霍霍向着InfiniBand

本文主要是介绍UEC(Ultra-Ethernet-consortium)新技术联盟,磨刀霍霍向着InfiniBand,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

许久没更了,最近天天在鼓捣高速端口,死磕112Gb/S 的一段日子。

新增Multi-Streams的功能支持,然后配合交换机的厂商各种验证测试(打鸡血.JPEG)

又在协助客户测试网卡的案子,天天被RDMA各种QP逻辑给烧脑


关注到新成立的一个高速互联技术联盟,粗略看起来就是要革InfiniBand 网络的命,那句话怎么说来着,天下苦IB网络久已... 

手动搬运了一下,英文原文可参考以下链接

https://www.linuxfoundation.org/press/announcing-ultra-ethernet-consortium-uec

UEC(Ultra-Ethernet-consortium)超级-以太网-联盟 

 UEC(Ultra-Ethernet-consortium) 将提供基于以太网的开放、互操作、高性能全通信栈架构,以满足人工智能和高性能计算日益增长的大规模网络需求。

旧金山- 2023 年 7 月 19 日--超以太网联盟(Ultra Ethernet Consortium,简称 UEC)今天宣布,将联合行业领先企业开展全行业合作,为高性能网络构建基于以太网的完整通信栈架构。人工智能(AI)和高性能计算(HPC)工作负载发展迅速,需要一流的功能、性能、互操作性和总体拥有成本,同时又不牺牲开发人员和最终用户的友好性。超以太网解决方案堆栈将利用以太网的普遍性和灵活性来处理各种工作负载,同时具有可扩展性和成本效益。

Ultra Ethernet Consortium 由在高性能解决方案领域拥有悠久历史和丰富经验的公司共同创建。每个成员都以平等的方式为更广泛的高性能生态系统做出了重大贡献。创始成员包括 AMD、Arista、Broadcom、思科、Eviden(Atos 业务)、HPE、英特尔、Meta 和微软,它们在网络、人工智能、云计算和高性能计算大规模部署方面共同拥有数十年的经验。

"超以太网联盟主席 J Metz 博士说:"这并不是要彻底改造以太网。超以太网联盟主席 J Metz 博士说:"这是为了调整以太网,以提高具有特定性能要求的工作负载的效率。我们正在研究

每一层--从物理层一直到软件层--以找到提高效率和性能的最佳方法。

该联盟将在保持和促进以太网互操作性的同时,最大限度地减少通信栈的变化。

联盟的技术目标是开发规范、应用程序接口和源代码,以定义

  • 以太网通信的协议、电气和光学信号特征、应用程序接口和/或数据结构。
  • 链路级和端到端网络传输协议,以扩展或取代现有的链路和传输协议。
  • 链路级和端到端拥塞、遥测和信号机制;上述每种机制都适用于人工智能、机器学习和高性能计算环境。
  • 软件、存储、管理和安全结构,以促进各种工作负载和操作环境。

UEC 将采用模块化、兼容、互操作层和紧密集成的系统方法,为要求苛刻的工作负载提供整体改进。创始公司将在四个工作组中为该联盟做出非常有价值的贡献: 物理层、链路层、传输层和软件层。

UEC 是由 Linux 基金会主办的联合发展基金会项目。UEC 将于 2023 年第四季度开始接受新成员申请。更多信息请访问 ultraethernet.org

行业分析师引言:

"许多高性能计算和人工智能用户发现,由于系统互连能力薄弱,他们很难从系统中获得全部性能。用户也很难集成和学习多个新的或不同的解决方案。令人兴奋的是,我们看到这群令人印象深刻的领先公司携手合作,共同打造了全新的通用高性能互连解决方案。高性能计算和人工智能领域的买家对工作负载的要求非常苛刻,而超以太网联盟(UEC)的方法将大大有助于提高互操作性、性能和功能。Hyperion Research 首席执行官 Earl Joseph 博士表示:"我们期待在不久的将来看到一系列新产品进入市场。

 "人工智能/移动计算(AI/ML)和高性能计算(HPC)的业务用例正在不断扩大,越来越多的公司希望利用可扩展计算来提高自己的竞争优势,无论是在自己的计算设施中还是在云中。目前,还没有标准的、供应商中立的数据中心网络解决方案,能够为并行应用提供大规模性能。由于大多数数据中心都是基于以太网的,因此由 UEC 驱动的可扩展解决方案将使可扩展性更直接、更容易获得。Intersect360 Research 首席执行官 Addison Snell 表示:"参与 UEC 的公司有能力开发出一致的以太网解决方案,从单一连接扩展到最大的超级计算机和超大规模数据中心。

 "关于支持生成式人工智能大型语言模型的训练和推理的基础架构所使用的最佳网络,人们一直在讨论,甚至可以说是在争论。一些公司已经转向基于以太网的网络,因为它更易于安装和使用。寒武纪人工智能研究公司(Cambrian-AI Research)创始人兼首席分析师卡尔-弗罗因德(Karl Freund)说:"UEC 计划将成为人工智能界一个受欢迎的新成员。

创始成员引言:

"高度计算密集型工作负载(如人工智能培训、机器学习以及高性能计算仿真和建模)需要可扩展且具有成本效益的全行业解决方案,而互操作性是重中之重。为了创建一个基于以太网的开放式架构,以满足现代数据中心工作负载不断发展的需求,我们作为创始成员加入了超以太网联盟。AMD公司数据中心解决方案集团架构与战略副总裁Robert Hormuth表示:"AMD在支持开放式行业标准方面有着悠久的历史,我们很荣幸今天能与UEC一起继续这一历程。

 "Arista Networks 软件工程集团副总裁 Hugh Holbrook 表示:"Arista Networks 很高兴参与 UEC,支持以太网作为 HPC 和 AI/ML 工作负载的普遍传输方式向更多用例演进。

"以太网凭借其无与伦比的生态系统、极高的灵活性和高性能,已成为几乎所有类型数据网络的首选结构。博通公司长期以来一直是以太网技术的支持者,推动着网络堆栈各个方面的创新。博通公司高级副总裁兼核心交换事业部总经理Ram Velaga表示:"我们很高兴能与众多云计算和网络行业巨头合作,推动以太网满足下一代人工智能和高性能计算网络的需求。

"我们正处于几乎所有行业大规模转型的起点。AI/ML 将从根本上改变我们做任何事情的内容、时间和方式。为了实现这一转变,业界需要在如何构建未来网络方面不断发展。思科支持 UEC 的目标,即确定和标准化优化,使我们部署 AI/ML 基础设施的客户受益。

 "高性能计算市场一直是开发高速互连产品的主要推动力。随着 AI/ML/DL 密集型和大规模工作负载的出现,市场正趋向于建立一个包含互操作性、成本效益和真正高性能的新标准。作为超以太网联盟(UEC)的创始成员之一,我们深感自豪并充满热情,该联盟旨在通过基于以太网的通信协议和软件栈来应对这些挑战。Atos将通过其Eviden业务,利用其BXI互连技术(该集团的第三代高速互连技术),为UEC提供经过现场验证的高性能计算和人工智能专业知识。阿托斯集团 Eviden 负责 HPC/AI/Quantum Portfolio & Strategy 的集团副总裁 Eric Eppe 表示:"我们相信,UEC 将带来强大的成果,满足市场的需求和要求。

"生成式人工智能工作负载将要求我们为超级计算的规模和性能构建网络。超以太网联盟的重要意义在于开发一个开放、可扩展、经济高效的基于以太网的通信栈,以支持这些高性能工作负载高效运行。以太网的普遍性和互操作性将为客户提供选择和性能,以处理各种数据密集型工作负载,包括模拟以及人工智能模型的训练和调整。随着人工智能模型的数据和规模不断增长,高度并行化计算成为性能、可靠性和可持续性的重要组成部分,"惠普企业公司HPC与人工智能执行副总裁兼总经理Justin Hotard说。 

 "人工智能、机器学习和大规模高性能工作负载对计算和网络性能的需求是无法满足的。业界需要开放的解决方案来满足这些需求,以便提供选择,摆脱专有解决方案的束缚。英特尔公司副总裁兼超级计算事业部总经理Jeff McVeigh表示:"英特尔很荣幸能成为超级以太网联盟(UEC)的创始成员,该联盟将通过更新和优化基于以太网的高性能、可扩展的开放式网络解决方案和通信堆栈,开创未来的计算基础设施。

 "下一代人工智能系统需要前所未有的规模和性能。 Meta 致力于构建一个高性能以太网结构和技术的开放生态系统,以实现下一个计算时代,"Meta 基础设施、人工智能系统和加速平台副总裁 Alexis Björlin 说。

"下一个计算时代将以人工智能和人工智能优化基础架构的突破性进展为特征,微软致力于增强企业的能力,利用 Azure 的强大功能突破可能实现的极限。微软公司Azure硬件架构副总裁Steve Scott表示:"联手开发一套通用标准,为超大规模人工智能和高性能计算工作负载增强以太网,将有助于现在和未来的持续创新。 

关于 Linux 基金会

Linux 基金会是全球领先的开源软件、硬件、标准和数据合作之家。Linux 基金会的项目对世界基础设施至关重要,包括 Linux、Kubernetes、Node.js、ONAP、PyTorch、RISC-V、SPDX、OpenChain 等。Linux 基金会致力于利用最佳实践,满足贡献者、用户和解决方案提供商的需求,以创建可持续的开放合作模式。欲了解更多信息,请访问我们的网站 linuxfoundation.org。Linux 基金会拥有注册商标并使用商标。欲了解 Linux 基金会的商标列表,请访问其商标使用页面:www.linuxfoundation.org/trademark-usage。Linux 是 Linus Torvalds 的注册商标。 

这篇关于UEC(Ultra-Ethernet-consortium)新技术联盟,磨刀霍霍向着InfiniBand的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/690374

相关文章

【专题】2024飞行汽车技术全景报告合集PDF分享(附原数据表)

原文链接: https://tecdat.cn/?p=37628 6月16日,小鹏汇天旅航者X2在北京大兴国际机场临空经济区完成首飞,这也是小鹏汇天的产品在京津冀地区进行的首次飞行。小鹏汇天方面还表示,公司准备量产,并计划今年四季度开启预售小鹏汇天分体式飞行汽车,探索分体式飞行汽车城际通勤。阅读原文,获取专题报告合集全文,解锁文末271份飞行汽车相关行业研究报告。 据悉,业内人士对飞行汽车行业

金融业开源技术 术语

金融业开源技术  术语 1  范围 本文件界定了金融业开源技术的常用术语。 本文件适用于金融业中涉及开源技术的相关标准及规范性文件制定和信息沟通等活动。

AI(文生语音)-TTS 技术线路探索学习:从拼接式参数化方法到Tacotron端到端输出

AI(文生语音)-TTS 技术线路探索学习:从拼接式参数化方法到Tacotron端到端输出 在数字化时代,文本到语音(Text-to-Speech, TTS)技术已成为人机交互的关键桥梁,无论是为视障人士提供辅助阅读,还是为智能助手注入声音的灵魂,TTS 技术都扮演着至关重要的角色。从最初的拼接式方法到参数化技术,再到现今的深度学习解决方案,TTS 技术经历了一段长足的进步。这篇文章将带您穿越时

系统架构设计师: 信息安全技术

简简单单 Online zuozuo: 简简单单 Online zuozuo 简简单单 Online zuozuo 简简单单 Online zuozuo 简简单单 Online zuozuo :本心、输入输出、结果 简简单单 Online zuozuo : 文章目录 系统架构设计师: 信息安全技术前言信息安全的基本要素:信息安全的范围:安全措施的目标:访问控制技术要素:访问控制包括:等保

前端技术(七)——less 教程

一、less简介 1. less是什么? less是一种动态样式语言,属于css预处理器的范畴,它扩展了CSS语言,增加了变量、Mixin、函数等特性,使CSS 更易维护和扩展LESS 既可以在 客户端 上运行 ,也可以借助Node.js在服务端运行。 less的中文官网:https://lesscss.cn/ 2. less编译工具 koala 官网 http://koala-app.

配置InfiniBand (IB) 和 RDMA over Converged Ethernet (RoCE) 网络

配置InfiniBand (IB) 和 RDMA over Converged Ethernet (RoCE) 网络 服务器端配置 在服务器端,你需要确保安装了必要的驱动程序和软件包,并且正确配置了网络接口。 安装 OFED 首先,安装 Open Fabrics Enterprise Distribution (OFED),它包含了 InfiniBand 所需的驱动程序和库。 sudo

Spring的设计⽬标——《Spring技术内幕》

读《Spring技术内幕》第二版,计文柯著。 如果我们要简要地描述Spring的设计⽬标,可以这么说,Spring为开发者提供的是⼀个⼀站式的轻量级应⽤开发框架(平台)。 作为平台,Spring抽象了我们在 许多应⽤开发中遇到的共性问题;同时,作为⼀个轻量级的应⽤开发框架,Spring和传统的J2EE开发相⽐,有其⾃⾝的特点。 通过这些⾃⾝的特点,Spring充分体现了它的设计理念:在

java线程深度解析(六)——线程池技术

http://blog.csdn.net/Daybreak1209/article/details/51382604 一种最为简单的线程创建和回收的方法: [html]  view plain copy new Thread(new Runnable(){                @Override               public voi

java线程深度解析(二)——线程互斥技术与线程间通信

http://blog.csdn.net/daybreak1209/article/details/51307679      在java多线程——线程同步问题中,对于多线程下程序启动时出现的线程安全问题的背景和初步解决方案已经有了详细的介绍。本文将再度深入解析对线程代码块和方法的同步控制和多线程间通信的实例。 一、再现多线程下安全问题 先看开启两条线程,分别按序打印字符串的

SSM项目使用AOP技术进行日志记录

本步骤只记录完成切面所需的必要代码 本人开发中遇到的问题: 切面一直切不进去,最后发现需要在springMVC的核心配置文件中中开启注解驱动才可以,只在spring的核心配置文件中开启是不会在web项目中生效的。 之后按照下面的代码进行配置,然后前端在访问controller层中的路径时即可观察到日志已经被正常记录到数据库,代码中有部分注释,看不懂的可以参照注释。接下来进入正题 1、导入m