服务器五大关键组件拆解分析

2024-08-23 07:28

本文主要是介绍服务器五大关键组件拆解分析,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

132426165daa6ea5f10a8f8a8e3a0b0c.jpeg

 拆解服务器五大关键组件

   

1d1f7767fc851367f1892f48f54c7033.jpeg

"AI服务器五大硬件揭秘:深入剖析PCB构造,揭示内部真实面貌。本文通过一步步拆解PCB,为读者呈现了一台服务器的内部世界,力求让您对服务器升级的潜在价值有更深的理解和把握。"

1、五大硬件部分可归纳为——GPU 板组、CPU 母板组、配件

英伟达DGX A100和DGX H100是两款具有标杆性产品力的产品。由于H100发布时间较短、资料详尽度不够,我们首先从DGX A100出发来观测具有产品力的AI服务器的基本架构。英伟达DGX A100外形类似于常见的家用主机,通过对部件构成进行深度分解,我们认为DGX A100大体上可以分为五个硬件板块。

1ee0b92b1ca965925d20f744fcde5d36.jpeg

优化后的文章如下:

从前部(Front)入手,首先映入眼帘的是风扇模组板块。DGX A100的风扇模组由8个高效风扇组成,这一设计巧妙地与传统服务器8U规格保持一致,为您的计算环境带来更强大的散热性能。

DGX A100 的硬盘和前控制台板被巧妙地安放在机箱的前部风扇模组板块下方,这款AI加速器拥有8块3.84TB的硬盘,为用户提供了高达30TB的超大内部存储空间。

您好,AI 服务器的 GPU 板组是整个服务器最为核心的组件组装区域之一,也是 AI 服务器区别于普通服务器的关键。从 DGXA100 的架构来看,GPU 板组主要包含 GPU 组件、模组板、NVSwitch 三块,这三块都会涉及到不同类型的 PCB 产品。

CPU 母板组是所有服务器的核心部件之一,其中包含 CPU 母板、系统内存、网卡、PCIE Switch 等部件。CPU 母板、系统内存、网卡是主要涉及到 PCB 用量的部分。

AI服务器的PCB价值量计算可归纳为三大部分:1. 核心GPU板组,2. 必备CPU母板组,3. 风扇、硬盘、电源等配件组。本文将详细解析这三大模块。

14f92660cfc7a8c0267c237160fb6f8a.jpeg

7e31147e6ef8f046da4bdd9d912d6d15.jpeg

2、GPU 板组:单机价值量 1.2 万,载板占比 52%、PCB 板占 48%

GPU 板组的 PCB 主要由 4 个部分组成,GPU 载板、NVSwitch、OAM、UBB。其中,GPU 载板是英伟达 A100 的 GPU 和 DRAM 采用 2.5/3D 先进封装工艺,用于承载的板材采用 70*70mm~100*100mm、14~16 层的 FCBGA 载板,数量上与 GPU 数量存在一一对应关系,按照 DGX A100 搭载 8 颗 GPU 的数量来看,1 台 AI 服务器需要用到 8 颗 GPU 载板;根据产业链调研,单颗价值量约为 100 美元,即 650 元人民币/颗,由此对应单机 GPU 载板价值量为 5200 元 。

0c8a4d9e336c265b69c5aaf4bf2bdb1f.jpeg

1) GPU 载板,英伟达 A100 的 GPU 和 DRAM 采用 2.5/3D 先进封装工艺,用于承载的板材采用 70*70mm~100*100mm、14~16 层的 FCBGA 载板,数量上与 GPU 数量存在一一对应关系,按照 DGX A100 搭载 8 颗 GPU 的数量来看,1 台 AI 服务器需要用到 8 颗 GPU 载板;根据产业链调研,单颗价值量约为 100 美元,即 650 元人民币/颗,由此对应单机 GPU 载板价值量为 5200 元。

2a9ef6c2013af60718556f985d593a32.jpeg

NVSwitch,一种基于NVLink标准的GPU间通信基础模组,其载体为载板式产品。加工性要求简单,关键在于承担大量高速数据传输任务。据产业链调研,单颗NVSwitch的价值约为30美元,即195元/颗。若A100搭载6颗NVSwitch,则单机价值量可达1170元。

38aa989a19fc65e16e674022229496ae.jpeg

3) OAM,OCP Accelerator Module,中文简称 GPU 加速卡,是用于承载 GPU 芯片的板卡,数量上看 OAM 与 GPU 存在一一对应的关系,以 DGX A100 搭载 8 个 GPU 的数量来看,1台 AI 服务器需要用到8块 OAM;面积上来看,借鉴 PCIE 版本 267.7mm*111.15mm的尺寸规格(内部 PCB 规格与外壳规格基本一致),可测算出 OAM 的面积尺寸约为0.03 平方米;

PCB 板型上来看,由于 OAM 涉及到 GPU 高速多线路信号传递,根据产业链调研,DGX A100 OAM 的 SXM 版本需要用到 20 层、Ultra Low Loss 等级 CCL 材料、4 阶 HDI 工艺,对应产品单价为 12000 元/平方米,DGX A100 OAM 的 PCIE 版本相对规格较低,只需要用到 14 层、Ultra Low Loss 和高 Tg FR4 等级 CCL 材料混压、1 阶 HDI 工艺,对应产品单价 7000 元/平方米。综合来看,如果按照 DGX A100 机型配置,高端 AI 服务器的 OAM 单价价值量将达到 2880 元。

8faf136051a0a9169a53151d45fb0502.jpeg

UBB,即Unit Baseboard,是专为搭载GPU平台设计的PCB板。每台AI服务器将配备一块UBB,据DGX A100整机底面规格和产业链调研显示,预估UBB的面积约为0.30平方米,需使用26层通孔PCB板。采用Ultra Low Loss CCL材料,单价约为10000元/平方米,对应单机价值量为3000元。

英伟达DGX A100 GPU板组包括GPU载板、NVSwitch、GPU加速卡和GPU模组板四部分,总单机PCB面积达0.624平方米,对应单机价值量为12,250元。其中,载板级别的产品占52%,单机价值量为6,370元;PCB级别的产品占48%,单机价值量为5,880元。

5f8bcba7a70b4dcdf403fc43c82cd06b.jpeg

3、CPU母板组:单机价值量2845元,载板占46%、主板占40%

CPU母板组包括:CPU载板、主板和配板。其中,功能性配板如系统内存卡、网卡、拓展卡和存储操作系统驱动板。

670be5ae9cc5f0683311597312fe6f57.jpeg

CPU载板与GPU载板规格相近,单颗CPU载板价值量100美元。若DGX搭载2颗CPU,则单机价值量约为1300元。

2)CPU 主板,主要用于承载 CPU 芯片、PCIE Switch 芯片、TPM 模组及各种功能性配板卡,该类 PCB 板的规格主要由 CPU 平台设计和总线标准,按照 DGX A100 的方案主要采用 64 核 AMD Rome 的 CPU 芯片、总线标准仍然为 PCIE 4.0,因此 CPU 主板仍然采用 10~12 层、Low Loss 等级 CCL 材料、通孔板的设计,根据产业链调研,单价约为3000 元/平方米;按照 DGX A100 的尺寸规格设计,估测 CPU 主板面积为 0.38 平方米,由此可计算 CPU 主板单机价值量为 1140 元。

根据产业链调研,功能性配板通常采用8-10层板、Mid Loss等级CCL,单价约为1500元/平方米。若参照DGX A100,面积和数量可参考该规格。

  • 英伟达DGX A100服务器配备了Mellanox ConnectX系列产品,其中包括X-7和X-6型号。标配的网卡数量为10张,包括8个单端口200Gb/s的IB和2个双端口200Gb/s以太网。据英伟达官网披露,Mellanox ConnectX-7的尺寸为68.90mm x 167.65mm。通过计算,我们可以得出单块网卡板的面积约为0.012平方米/张。
  • 在DGX A100服务器中,为了充分利用板卡摆放设计,需要添加一些拓展卡来扩展PCIe接口。由于该服务器配备了一张横置的Storage networking网卡,因此需要一张专门的拓展卡。据产业链调研显示,每张拓展卡的面积约为0.01平方米。
  • DGX A100的存储操作系统驱动板,拥有2个1.92TB M.2 NVMe系统驱动器,巧妙地设计在一张PCB板上的两面。这样独特的布局,让系统驱动板仅有1块,面积约为0.01平方米/张,实现了高性能与紧凑设计的完美结合。


上述四部分合计,功能性配板单机面积为0.27平方米,对应单机价值量约为405元。

经过综合分析,英伟达DGX A100 CPU母板组PCB用量总面积约为0.662平方米,单机价值约2845元。其中,载板级产品占46%,主板产品占40%,配板产品占14%。

7bcdcc7d0d3d868c67af92ef83c40724.jpeg

4、其他配件:单机价值量合计 226 元

除了GPU板组和CPU模板组,其他配件还包括电源、硬盘、前控制台板等。根据产业链调研,这类产品主要采用6~10层、FR4/Mid Loss等级CCL的规格,单价约为1000~1500元/平方米不等。参照DGX A100规格对用量和面积进行计算,可得出相应的成本。

DGX A100配置了6个电源,与台达电2200W服务器电源DPS-2200-AB-2型号相似。根据其73.5*265.0mm的规格,我们估计每个电源所需的PCB板面积约为0.019平方米。

dc02e2735efa54d6d896818e391f1f83.jpeg

2)DGX A100搭配8个硬盘,根据行业标准3.5英寸盘,估测单块硬盘PCB面积为0.008平方米。

3) 前控制台板:用于控制外接设备,置于8个硬盘间的一块PCB板。据产业链调研,估测面积约为0.010平方米。

经过综合分析,我们预测DGX A100整机的PCB用量面积约为1.474平方米,单机价值量为15321元。其中,GPU板组单机价值量最高,达到1.2万元,占比达80%;CPU母板组单机价值量为2845元,占比19%;其他配件单机价值量为226元,占比1%。从板级分类来看,载板级别单机价值量为7670元,占比50.1%;PCB板级单机价值量为7651元,占比49.9%。


-对此,您有什么看法见解?-

-欢迎在评论区留言探讨和分享。-

这篇关于服务器五大关键组件拆解分析的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1098732

相关文章

JS常用组件收集

收集了一些平时遇到的前端比较优秀的组件,方便以后开发的时候查找!!! 函数工具: Lodash 页面固定: stickUp、jQuery.Pin 轮播: unslider、swiper 开关: switch 复选框: icheck 气泡: grumble 隐藏元素: Headroom

服务器集群同步时间手记

1.时间服务器配置(必须root用户) (1)检查ntp是否安装 [root@node1 桌面]# rpm -qa|grep ntpntp-4.2.6p5-10.el6.centos.x86_64fontpackages-filesystem-1.41-1.1.el6.noarchntpdate-4.2.6p5-10.el6.centos.x86_64 (2)修改ntp配置文件 [r

性能分析之MySQL索引实战案例

文章目录 一、前言二、准备三、MySQL索引优化四、MySQL 索引知识回顾五、总结 一、前言 在上一讲性能工具之 JProfiler 简单登录案例分析实战中已经发现SQL没有建立索引问题,本文将一起从代码层去分析为什么没有建立索引? 开源ERP项目地址:https://gitee.com/jishenghua/JSH_ERP 二、准备 打开IDEA找到登录请求资源路径位置

如何在页面调用utility bar并传递参数至lwc组件

1.在app的utility item中添加lwc组件: 2.调用utility bar api的方式有两种: 方法一,通过lwc调用: import {LightningElement,api ,wire } from 'lwc';import { publish, MessageContext } from 'lightning/messageService';import Ca

SWAP作物生长模型安装教程、数据制备、敏感性分析、气候变化影响、R模型敏感性分析与贝叶斯优化、Fortran源代码分析、气候数据降尺度与变化影响分析

查看原文>>>全流程SWAP农业模型数据制备、敏感性分析及气候变化影响实践技术应用 SWAP模型是由荷兰瓦赫宁根大学开发的先进农作物模型,它综合考虑了土壤-水分-大气以及植被间的相互作用;是一种描述作物生长过程的一种机理性作物生长模型。它不但运用Richard方程,使其能够精确的模拟土壤中水分的运动,而且耦合了WOFOST作物模型使作物的生长描述更为科学。 本文让更多的科研人员和农业工作者

MOLE 2.5 分析分子通道和孔隙

软件介绍 生物大分子通道和孔隙在生物学中发挥着重要作用,例如在分子识别和酶底物特异性方面。 我们介绍了一种名为 MOLE 2.5 的高级软件工具,该工具旨在分析分子通道和孔隙。 与其他可用软件工具的基准测试表明,MOLE 2.5 相比更快、更强大、功能更丰富。作为一项新功能,MOLE 2.5 可以估算已识别通道的物理化学性质。 软件下载 https://pan.quark.cn/s/57

Linux服务器Java启动脚本

Linux服务器Java启动脚本 1、初版2、优化版本3、常用脚本仓库 本文章介绍了如何在Linux服务器上执行Java并启动jar包, 通常我们会使用nohup直接启动,但是还是需要手动停止然后再次启动, 那如何更优雅的在服务器上启动jar包呢,让我们一起探讨一下吧。 1、初版 第一个版本是常用的做法,直接使用nohup后台启动jar包, 并将日志输出到当前文件夹n

衡石分析平台使用手册-单机安装及启动

单机安装及启动​ 本文讲述如何在单机环境下进行 HENGSHI SENSE 安装的操作过程。 在安装前请确认网络环境,如果是隔离环境,无法连接互联网时,请先按照 离线环境安装依赖的指导进行依赖包的安装,然后按照本文的指导继续操作。如果网络环境可以连接互联网,请直接按照本文的指导进行安装。 准备工作​ 请参考安装环境文档准备安装环境。 配置用户与安装目录。 在操作前请检查您是否有 sud

线性因子模型 - 独立分量分析(ICA)篇

序言 线性因子模型是数据分析与机器学习中的一类重要模型,它们通过引入潜变量( latent variables \text{latent variables} latent variables)来更好地表征数据。其中,独立分量分析( ICA \text{ICA} ICA)作为线性因子模型的一种,以其独特的视角和广泛的应用领域而备受关注。 ICA \text{ICA} ICA旨在将观察到的复杂信号

【软考】希尔排序算法分析

目录 1. c代码2. 运行截图3. 运行解析 1. c代码 #include <stdio.h>#include <stdlib.h> void shellSort(int data[], int n){// 划分的数组,例如8个数则为[4, 2, 1]int *delta;int k;// i控制delta的轮次int i;// 临时变量,换值int temp;in