Nvidia DGX 系统分析和探讨

2024-04-15 21:28
文章标签 nvidia 探讨 系统分析 dgx

本文主要是介绍Nvidia DGX 系统分析和探讨,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

NVIDIA DGX 互联结构

在这里插入图片描述
NVIDIA DGX 是Nvidia 推出的turnkey 解决方案,其中按照组合关系:

  • DGX GB200 System: NVL72
    • 36 Nvidia Grace CPU
    • 72 BlackWell GPU
    • 每台机柜包含18 个GB200 计算节点,每个节点包含2 个GB200s
    • 9 个NVSwitches Tray 节点,每个2 颗 NVSwitch 芯片
    • 节点间使用nvlink 进行互联,互联线缆使用铜(Cooper),不需要光收发器(铜进光退)

    1.4 exaFLOPS of AI performance, 30 terabytes (TB) of fast memory, and 130 terabytes per second (TB/s) of bidirectional GPU bandwidth.

在这里插入图片描述
下图为1U 高度的NVL72 单节点实物形态,其中每个节点包含两组GB200s 系统,整合水冷散热。

![在这里插入图片描述](https://img-blog.csdnimg.cn/direct/987b768da14344eab5fc9201aecc41ed.png在这里插入图片描述

实物NVL72 机柜
![实物NVL72 机柜](https://img-blog.csdnimg.cn/direct/5398d8a1102a4a35acec66e85dc9e4d8.png
在这里插入图片描述

  • DGX SuperPOD™:最多576 组DGX GB200 系统组成超级pod
  • DGX GB200 BasePod

Rank 之间的互联通过 Infiniband
Rank 内的互联通 Nvlink

NVidia发布了GB200 NVL72 解决方案架构, 我们以公开的资料进一步探讨下NV的DGX 内部互联结构.

![在这里插入图片描述](https://img-blog.csdnimg.cn/direct/c1fe6b6b88ba4226a0dfae63dd771c5f.png在这里插入图片描述

DGX 软件架构

作为TurnKey 解决方案, DGX 具备完备的软件栈, 实现开箱即用的交付.
在这里插入图片描述

这篇关于Nvidia DGX 系统分析和探讨的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/906967

相关文章

一台电脑对应一个IP地址吗?‌探讨两台电脑共用IP的可能性

在当今数字化时代,‌IP地址作为网络世界中的“门牌号”,‌扮演着至关重要的角色。‌它负责在网络上唯一标识每一台设备,‌使得数据能够在庞大的互联网中准确无误地传输。‌然而,‌对于IP地址与电脑之间的对应关系,‌许多人可能存有疑惑:‌一台电脑是否必须对应一个IP地址?‌两台电脑又是否可以共用一个IP地址呢?‌本文将深入探讨这些问题,‌带您一窥IP地址背后的奥秘。‌ 一台电脑对应一个IP地址吗?‌

使用Python控制Excel应用:打开与关闭工作簿的技术性探讨

目录 引言 一、安装必要的库 1. xlwings 2. openpyxl 二、使用xlwings打开和关闭Excel工作簿 2.1 启动和退出Excel 2.2 打开和关闭工作簿 2.3 创建新工作簿 三、使用openpyxl打开和关闭Excel工作簿 3.1 打开工作簿 3.2 保存和关闭工作簿 四、案例分析 4.1 读取Excel文件中的数据 4.2 写入数据到E

Kubernetes的alpha.kubernetes.io/nvidia-gpu无法限制GPU个数

问题描述: Pod.yaml文件中关于GPU资源的设置如下: 然而在docker中运行GPU程序时,发现宿主机上的两块GPU都在跑。甚至在yaml文件中删除关于GPU的请求,在docker中都可以运行GPU。 原因: 上例说明alpha.kubernetes.io/nvidia-gpu无效。查看yaml文件,发现该docker开启了特权模式(privileged:ture): 而

Ubuntu安装docker及nvidia-docker2

Ubuntu 通过apt安装 Ubuntu安装docker后再安装nvidia-docker2时经常出现版本不匹配的问题,可以分以下两步安装: # 安装dockerexport VERSION=18.06.1-ce && curl -sSL get.docker.com | sh# 安装nvidia-docker2curl -s -L https://nvidia.github.io/nv

AI超周期现状 - NVIDIA、苹果以及人工智能的整体需求

于2024年6月6日在中国杭州拍摄的英伟达和苹果的标志。到6月5日,东部时间,英伟达的市值超过3万亿美元,正式超越苹果的市值,成为全球市值第二大的科技巨头。值得注意的是,短短3个多月时间里,英伟达的市值就从2万亿美元飙升至3万亿美元。(由Costfoto摄于NurPhoto,经盖蒂图片社批准) 在九月初经历了几天的市场动荡后,又有一波关于人工智能超级周期是否已结束的讨论。如果没有结束,那接下来会

Kafka的分区数与多线程消费探讨

大数据技术与架构 点击右侧关注,大数据开发领域最强公众号! 暴走大数据 点击右侧关注,暴走大数据! 典型的high-level Consumer的API如下: Properties props = new Properties(); props.put("zookeeper.connect", "xxxx:2181"); props.put("zookeeper.conne

centos 安装 nvidia的两种方式

大部分 Linux 发行版都使用开源的显卡驱动 nouveau,对于 nvidia 显卡来说,还是闭源的官方驱动的效果更好。最明显的一点是,在使用 SAC 拾取震相的时候,使用官方显卡驱动在刷新界面的时候要快很多。 对于 CentOS 用户而言,有两种安装 NVIDIA 显卡驱动的方法,从 ELRepo 源中安装或从源码编译驱动。对于一般的 CentOS 用户,建议使用第一种方法。 注意

java 深拷贝探讨

java 深拷贝探讨 本文将讨论以下4个问题 1. java Cloneable接口实现深拷贝2. java 序列化实现深拷贝3. 号称最快的深拷贝二方库cloning源码分析4. 几种拷贝方式速度的比较 深拷贝的概念本文就不说了。在C++中实现深拷贝一般情况下重载赋值操作符 “=” 来实现同一个类的对象间的深拷贝,所以很自然的在java中我们也同样可以定义一个copy函数,在函数内

1、快速响应市场和技术变化的深度探讨

在当今技术飞速发展和市场竞争日益激烈的时代,企业面临的最大挑战之一就是如何快速响应市场和技术变化。市场需求不断变化,新技术层出不穷,传统的静态计划和僵化的管理方式已经无法满足快速变化的需求。本文将深入探讨“快速响应市场和技术变化”的关键点,从信息流通、组织架构、决策机制、技术应用到文化和领导力进行详细分析,帮助企业建立高效的响应机制。 1. 信息流通和感知能力建设 信息流通和感

NVIDIA RTX 50系列大爆料:功耗飙升600W,性能直逼RTX 4090 1.?倍,你准备好了吗?

在科技圈的万众瞩目下,知名硬件爆料大神Kopite7kimi再次为我们揭开了NVIDIA下一代GeForce RTX系列——“Blackwell”阵容的神秘面纱。这次,关于新显卡的功耗信息不再是模糊的概念,而是实实在在的数字,让人不禁对即将到来的性能飞跃充满期待。 功耗飙升,性能也要飞? 据Kopite7kimi确认,RTX 50系列中的旗舰型号RTX 5090将拥有惊人的功耗表现,其最高功