8304亿元建数据中心,OpenAI想用以太网交换机替代IB?

2024-04-09 16:44

本文主要是介绍8304亿元建数据中心,OpenAI想用以太网交换机替代IB?,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

据 IT 外媒《The Information》近日报道,微软和 OpenAI 正在共建一个大型数据中心“星际之门”(Stargate),以容纳一台面向 AI 的超级计算机,该项目可能耗资超过 1150 亿美元(8304 亿元人民币)。尽管微软在当前的项目中使用了IB线缆,在网络基础设施方面,OpenAI倾向于使用开放以太网协议取代Nvidia InfiniBand(简称IB),旨在摆脱对英伟达的依赖

自AI大火以来,市场对英伟达GPU需求量居高不下,英伟达因此拥有了市场定价权,像微软和OpenAI这样的公司不愿被厂商绑定、希望另辟蹊径的公司不在少数,国内诸如字节跳动等互联网大厂也纷纷自研交换机,今天做一台高端的交换机比以往任何时候都要容易。

与过去少数几个通信厂家靠着大机箱、大背板、大电源建立起高门槛的市场形势不同,现在可以用CLOS架构去背板,使用通用的硬件设计;在“软件定义一切”的时代,开放标准SAI和开源SONiC为用户提供更灵活、可定制和高性能的网络解决方案;加上国内外领先的芯片公司和软件公司给更多中小厂家提供了一个做自己交换机的开放底座,似乎只要拥有编程能力,多尝试便能自研交换机,自己构建网络。但事实果真如此吗?

对于许多AI企业来说,自研交换机付出的时间成本远高于直接购买交换机,且碍于IB交换机供货周期长、IB网络故障高度依赖原厂等问题,找到性能媲美IB的以太网交换机是降低网络部署成本的关键点,应该如何找到合适的厂商呢?


星融元是国内唯一提供软硬一体的一站式企业级开放网络解决方案的供应商,经过多年的技术探索和经验积累,星融元收获许多企业的认可,在海内外已多次实现数据中心交换机的规模化部署。

 ✦星智AI网络解决方案轻松组建智算中心万卡网络,满足用户智算中心网络建设需求的同时,也避免了传统网络在智算中心的不足。 

  • 不影响性能的情况下,网络架构精简极大的降低用户网络建设成本 
  • 网络只需1跳,减少业务时延 
  • 网络结构简化,降低运维以及故障排查难度 

以32768个GPU,128端口交换机组网为例: 

CLOS层数:1层(Rail Only) 

交换机需要:256台

光发射器数量:65536

网络成本最大可降低:75%

方案详情请点击查看:针对LLM大模型承载网发布星智AI网络解决方案

✦AI方案以外,还提供分布式存储网络解决方案和全以太HPC网络解决方案,可以为高性能计算集群提供真正意义上的低时延、零丢包、高性能的无损网络。在HPC 和分布式存储的方案现场测试中,星融元和IB交换机的数据相近,端到端可媲美甚至优于IB交换机。

方案详情请点击查看:

星融元发布基于RoCE的分布式存储网络解决方案
星融元发布基于超低时延交换机的全以太HPC网络解决方案

Dell'Oro预测AI需求将促使数据中心交换机市场扩大50%,交换机市场鱼龙复杂,选择部署数据中心交换机的厂商时,备受市场青睐和研究报告认可的星融元是国内AI企业的最好选择,毕竟谁会拒绝一台性能优越、成本低廉、供货周期短、售后服务周到的数据中心交换机呢?

关注vx公号“星融元Asterfusion”,获取更多技术分享和最新产品动态。

这篇关于8304亿元建数据中心,OpenAI想用以太网交换机替代IB?的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/888687

相关文章

Ilya-AI分享的他在OpenAI学习到的15个提示工程技巧

Ilya(不是本人,claude AI)在社交媒体上分享了他在OpenAI学习到的15个Prompt撰写技巧。 以下是详细的内容: 提示精确化:在编写提示时,力求表达清晰准确。清楚地阐述任务需求和概念定义至关重要。例:不用"分析文本",而用"判断这段话的情感倾向:积极、消极还是中性"。 快速迭代:善于快速连续调整提示。熟练的提示工程师能够灵活地进行多轮优化。例:从"总结文章"到"用

配置InfiniBand (IB) 和 RDMA over Converged Ethernet (RoCE) 网络

配置InfiniBand (IB) 和 RDMA over Converged Ethernet (RoCE) 网络 服务器端配置 在服务器端,你需要确保安装了必要的驱动程序和软件包,并且正确配置了网络接口。 安装 OFED 首先,安装 Open Fabrics Enterprise Distribution (OFED),它包含了 InfiniBand 所需的驱动程序和库。 sudo

InfiniBand (IB) 和 RDMA over Converged Ethernet (RoCE)

在超算网络环境中,InfiniBand (IB) 和 RDMA over Converged Ethernet (RoCE) 是两种重要的网络技术,它们旨在提供高性能、低延迟的数据传输能力,适用于大规模并行计算任务。下面是对这两个技术的具体名词解释和应用场景的详细说明。 InfiniBand (IB) 名词解释 InfiniBand (IB):InfiniBand 是一种高性能计算和企业数据

以太网交换机工作原理学习笔记

在网络中传输数据时需要遵循一些标准,以太网协议定义了数据帧在以太网上的传输标准,了解以太网协议是充分理解数据链路层通信的基础。以太网交换机是实现数据链路层通信的主要设备,了解以太网交换机的工作原理也是十分必要的。 1、以太网协议介绍 1.1以太网协议 以太网是当今现有局域网(Local Area Network, LAN)采用的最通用的通信协议标准,该标准定义了在局域网中采用的电缆类型和信号

半年高达552亿元,锁定云第一,中国电信天翼云紧追不舍

【科技明说 | 科技热点关注】 刚才我注意到中国电信公布2024年中期业绩,报告期内,中国电信实现营业收入为人民币2660亿元,同比增长2.8%,其中服务收入为人民币2462亿元,同比增长4.3%;净利润为人民币218亿元,同比增长8.2%。 其中亮点,2024年上半年,天翼云保持快速增长,收入达到了552亿元,同比增长20.4%,占服务收入比升至22.4%,市场头部地位进一步巩固。 为

使用http-request 属性替代action绑定上传URL

在 Element UI 的 <el-upload> 组件中,如果你需要为上传的 HTTP 请求添加自定义的请求头(例如,为了通过身份验证或满足服务器端的特定要求),你不能直接在 <el-upload> 组件的属性中设置这些请求头。但是,你可以通过 http-request 属性来自定义上传的行为,包括设置请求头。 http-request 属性允许你完全控制上传的行为,包括如何构建请求、发送请

How can I load the openai api configuration through js in html?

题意:怎样在HTML中通过JavaScript加载OpenAI API配置 问题背景: I am trying to send a request through js in my html so that openai analyzes it and sends a response, but if in the js I put the following: 我正在尝试通过HTM

Anthropic 创始人 Dario Amodei 谈:关于护城河与风险,AI 大很难直接替代人

护城河的迷思   近期,Anthropic创始人Dario Amodei与投资人Erik Torenberg进行了一场引人关注的对话。他们探讨了AI的护城河与潜在风险。话说,护城河就像酒水的保质期,过了时间就得小心别翻车。Amodei提到,AI虽有强大的潜力,但短期内难以完全替代人类的智慧。这可让很多人松了一口气,毕竟机器发热总比人心复杂,听着都觉得不舒服。 聪明与控制的博弈   Dar

Creating OpenAI Gym Environment from Map Data

题意:从地图数据创建 OpenAI Gym 环境 问题背景: I am just starting out with reinforcement learning and trying to create a custom environment with OpenAI gym. However, I am stumped with trying to create an enviro

OpenAI澄清:“GPT Next”不是新模型。

不,”GPT Next” 并不是OpenAI的下一个重要项目。 本周早些时候,OpenAI 日本业务的负责人长崎忠男在日本 KDDI 峰会上分享了一场演讲,似乎在暗示一个名为 “GPT Next” 的新模型即将出现。 但OpenAI的一位发言人已向Mashable证实,幻灯片中用引号括起来的”GPT Next”一词只是一个假设性占位符,旨在表明OpenAI的模型如何随着时间呈指数级进化。发言人