服务器五大关键组件拆解分析

2024-08-23 07:28

本文主要是介绍服务器五大关键组件拆解分析,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

132426165daa6ea5f10a8f8a8e3a0b0c.jpeg

 拆解服务器五大关键组件

   

1d1f7767fc851367f1892f48f54c7033.jpeg

"AI服务器五大硬件揭秘:深入剖析PCB构造,揭示内部真实面貌。本文通过一步步拆解PCB,为读者呈现了一台服务器的内部世界,力求让您对服务器升级的潜在价值有更深的理解和把握。"

1、五大硬件部分可归纳为——GPU 板组、CPU 母板组、配件

英伟达DGX A100和DGX H100是两款具有标杆性产品力的产品。由于H100发布时间较短、资料详尽度不够,我们首先从DGX A100出发来观测具有产品力的AI服务器的基本架构。英伟达DGX A100外形类似于常见的家用主机,通过对部件构成进行深度分解,我们认为DGX A100大体上可以分为五个硬件板块。

1ee0b92b1ca965925d20f744fcde5d36.jpeg

优化后的文章如下:

从前部(Front)入手,首先映入眼帘的是风扇模组板块。DGX A100的风扇模组由8个高效风扇组成,这一设计巧妙地与传统服务器8U规格保持一致,为您的计算环境带来更强大的散热性能。

DGX A100 的硬盘和前控制台板被巧妙地安放在机箱的前部风扇模组板块下方,这款AI加速器拥有8块3.84TB的硬盘,为用户提供了高达30TB的超大内部存储空间。

您好,AI 服务器的 GPU 板组是整个服务器最为核心的组件组装区域之一,也是 AI 服务器区别于普通服务器的关键。从 DGXA100 的架构来看,GPU 板组主要包含 GPU 组件、模组板、NVSwitch 三块,这三块都会涉及到不同类型的 PCB 产品。

CPU 母板组是所有服务器的核心部件之一,其中包含 CPU 母板、系统内存、网卡、PCIE Switch 等部件。CPU 母板、系统内存、网卡是主要涉及到 PCB 用量的部分。

AI服务器的PCB价值量计算可归纳为三大部分:1. 核心GPU板组,2. 必备CPU母板组,3. 风扇、硬盘、电源等配件组。本文将详细解析这三大模块。

14f92660cfc7a8c0267c237160fb6f8a.jpeg

7e31147e6ef8f046da4bdd9d912d6d15.jpeg

2、GPU 板组:单机价值量 1.2 万,载板占比 52%、PCB 板占 48%

GPU 板组的 PCB 主要由 4 个部分组成,GPU 载板、NVSwitch、OAM、UBB。其中,GPU 载板是英伟达 A100 的 GPU 和 DRAM 采用 2.5/3D 先进封装工艺,用于承载的板材采用 70*70mm~100*100mm、14~16 层的 FCBGA 载板,数量上与 GPU 数量存在一一对应关系,按照 DGX A100 搭载 8 颗 GPU 的数量来看,1 台 AI 服务器需要用到 8 颗 GPU 载板;根据产业链调研,单颗价值量约为 100 美元,即 650 元人民币/颗,由此对应单机 GPU 载板价值量为 5200 元 。

0c8a4d9e336c265b69c5aaf4bf2bdb1f.jpeg

1) GPU 载板,英伟达 A100 的 GPU 和 DRAM 采用 2.5/3D 先进封装工艺,用于承载的板材采用 70*70mm~100*100mm、14~16 层的 FCBGA 载板,数量上与 GPU 数量存在一一对应关系,按照 DGX A100 搭载 8 颗 GPU 的数量来看,1 台 AI 服务器需要用到 8 颗 GPU 载板;根据产业链调研,单颗价值量约为 100 美元,即 650 元人民币/颗,由此对应单机 GPU 载板价值量为 5200 元。

2a9ef6c2013af60718556f985d593a32.jpeg

NVSwitch,一种基于NVLink标准的GPU间通信基础模组,其载体为载板式产品。加工性要求简单,关键在于承担大量高速数据传输任务。据产业链调研,单颗NVSwitch的价值约为30美元,即195元/颗。若A100搭载6颗NVSwitch,则单机价值量可达1170元。

38aa989a19fc65e16e674022229496ae.jpeg

3) OAM,OCP Accelerator Module,中文简称 GPU 加速卡,是用于承载 GPU 芯片的板卡,数量上看 OAM 与 GPU 存在一一对应的关系,以 DGX A100 搭载 8 个 GPU 的数量来看,1台 AI 服务器需要用到8块 OAM;面积上来看,借鉴 PCIE 版本 267.7mm*111.15mm的尺寸规格(内部 PCB 规格与外壳规格基本一致),可测算出 OAM 的面积尺寸约为0.03 平方米;

PCB 板型上来看,由于 OAM 涉及到 GPU 高速多线路信号传递,根据产业链调研,DGX A100 OAM 的 SXM 版本需要用到 20 层、Ultra Low Loss 等级 CCL 材料、4 阶 HDI 工艺,对应产品单价为 12000 元/平方米,DGX A100 OAM 的 PCIE 版本相对规格较低,只需要用到 14 层、Ultra Low Loss 和高 Tg FR4 等级 CCL 材料混压、1 阶 HDI 工艺,对应产品单价 7000 元/平方米。综合来看,如果按照 DGX A100 机型配置,高端 AI 服务器的 OAM 单价价值量将达到 2880 元。

8faf136051a0a9169a53151d45fb0502.jpeg

UBB,即Unit Baseboard,是专为搭载GPU平台设计的PCB板。每台AI服务器将配备一块UBB,据DGX A100整机底面规格和产业链调研显示,预估UBB的面积约为0.30平方米,需使用26层通孔PCB板。采用Ultra Low Loss CCL材料,单价约为10000元/平方米,对应单机价值量为3000元。

英伟达DGX A100 GPU板组包括GPU载板、NVSwitch、GPU加速卡和GPU模组板四部分,总单机PCB面积达0.624平方米,对应单机价值量为12,250元。其中,载板级别的产品占52%,单机价值量为6,370元;PCB级别的产品占48%,单机价值量为5,880元。

5f8bcba7a70b4dcdf403fc43c82cd06b.jpeg

3、CPU母板组:单机价值量2845元,载板占46%、主板占40%

CPU母板组包括:CPU载板、主板和配板。其中,功能性配板如系统内存卡、网卡、拓展卡和存储操作系统驱动板。

670be5ae9cc5f0683311597312fe6f57.jpeg

CPU载板与GPU载板规格相近,单颗CPU载板价值量100美元。若DGX搭载2颗CPU,则单机价值量约为1300元。

2)CPU 主板,主要用于承载 CPU 芯片、PCIE Switch 芯片、TPM 模组及各种功能性配板卡,该类 PCB 板的规格主要由 CPU 平台设计和总线标准,按照 DGX A100 的方案主要采用 64 核 AMD Rome 的 CPU 芯片、总线标准仍然为 PCIE 4.0,因此 CPU 主板仍然采用 10~12 层、Low Loss 等级 CCL 材料、通孔板的设计,根据产业链调研,单价约为3000 元/平方米;按照 DGX A100 的尺寸规格设计,估测 CPU 主板面积为 0.38 平方米,由此可计算 CPU 主板单机价值量为 1140 元。

根据产业链调研,功能性配板通常采用8-10层板、Mid Loss等级CCL,单价约为1500元/平方米。若参照DGX A100,面积和数量可参考该规格。

  • 英伟达DGX A100服务器配备了Mellanox ConnectX系列产品,其中包括X-7和X-6型号。标配的网卡数量为10张,包括8个单端口200Gb/s的IB和2个双端口200Gb/s以太网。据英伟达官网披露,Mellanox ConnectX-7的尺寸为68.90mm x 167.65mm。通过计算,我们可以得出单块网卡板的面积约为0.012平方米/张。
  • 在DGX A100服务器中,为了充分利用板卡摆放设计,需要添加一些拓展卡来扩展PCIe接口。由于该服务器配备了一张横置的Storage networking网卡,因此需要一张专门的拓展卡。据产业链调研显示,每张拓展卡的面积约为0.01平方米。
  • DGX A100的存储操作系统驱动板,拥有2个1.92TB M.2 NVMe系统驱动器,巧妙地设计在一张PCB板上的两面。这样独特的布局,让系统驱动板仅有1块,面积约为0.01平方米/张,实现了高性能与紧凑设计的完美结合。


上述四部分合计,功能性配板单机面积为0.27平方米,对应单机价值量约为405元。

经过综合分析,英伟达DGX A100 CPU母板组PCB用量总面积约为0.662平方米,单机价值约2845元。其中,载板级产品占46%,主板产品占40%,配板产品占14%。

7bcdcc7d0d3d868c67af92ef83c40724.jpeg

4、其他配件:单机价值量合计 226 元

除了GPU板组和CPU模板组,其他配件还包括电源、硬盘、前控制台板等。根据产业链调研,这类产品主要采用6~10层、FR4/Mid Loss等级CCL的规格,单价约为1000~1500元/平方米不等。参照DGX A100规格对用量和面积进行计算,可得出相应的成本。

DGX A100配置了6个电源,与台达电2200W服务器电源DPS-2200-AB-2型号相似。根据其73.5*265.0mm的规格,我们估计每个电源所需的PCB板面积约为0.019平方米。

dc02e2735efa54d6d896818e391f1f83.jpeg

2)DGX A100搭配8个硬盘,根据行业标准3.5英寸盘,估测单块硬盘PCB面积为0.008平方米。

3) 前控制台板:用于控制外接设备,置于8个硬盘间的一块PCB板。据产业链调研,估测面积约为0.010平方米。

经过综合分析,我们预测DGX A100整机的PCB用量面积约为1.474平方米,单机价值量为15321元。其中,GPU板组单机价值量最高,达到1.2万元,占比达80%;CPU母板组单机价值量为2845元,占比19%;其他配件单机价值量为226元,占比1%。从板级分类来看,载板级别单机价值量为7670元,占比50.1%;PCB板级单机价值量为7651元,占比49.9%。


-对此,您有什么看法见解?-

-欢迎在评论区留言探讨和分享。-

这篇关于服务器五大关键组件拆解分析的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1098732

相关文章

ElasticSearch+Kibana通过Docker部署到Linux服务器中操作方法

《ElasticSearch+Kibana通过Docker部署到Linux服务器中操作方法》本文介绍了Elasticsearch的基本概念,包括文档和字段、索引和映射,还详细描述了如何通过Docker... 目录1、ElasticSearch概念2、ElasticSearch、Kibana和IK分词器部署

部署Vue项目到服务器后404错误的原因及解决方案

《部署Vue项目到服务器后404错误的原因及解决方案》文章介绍了Vue项目部署步骤以及404错误的解决方案,部署步骤包括构建项目、上传文件、配置Web服务器、重启Nginx和访问域名,404错误通常是... 目录一、vue项目部署步骤二、404错误原因及解决方案错误场景原因分析解决方案一、Vue项目部署步骤

Linux流媒体服务器部署流程

《Linux流媒体服务器部署流程》文章详细介绍了流媒体服务器的部署步骤,包括更新系统、安装依赖组件、编译安装Nginx和RTMP模块、配置Nginx和FFmpeg,以及测试流媒体服务器的搭建... 目录流媒体服务器部署部署安装1.更新系统2.安装依赖组件3.解压4.编译安装(添加RTMP和openssl模块

Springboot中分析SQL性能的两种方式详解

《Springboot中分析SQL性能的两种方式详解》文章介绍了SQL性能分析的两种方式:MyBatis-Plus性能分析插件和p6spy框架,MyBatis-Plus插件配置简单,适用于开发和测试环... 目录SQL性能分析的两种方式:功能介绍实现方式:实现步骤:SQL性能分析的两种方式:功能介绍记录

最长公共子序列问题的深度分析与Java实现方式

《最长公共子序列问题的深度分析与Java实现方式》本文详细介绍了最长公共子序列(LCS)问题,包括其概念、暴力解法、动态规划解法,并提供了Java代码实现,暴力解法虽然简单,但在大数据处理中效率较低,... 目录最长公共子序列问题概述问题理解与示例分析暴力解法思路与示例代码动态规划解法DP 表的构建与意义动

JavaWeb-WebSocket浏览器服务器双向通信方式

《JavaWeb-WebSocket浏览器服务器双向通信方式》文章介绍了WebSocket协议的工作原理和应用场景,包括与HTTP的对比,接着,详细介绍了如何在Java中使用WebSocket,包括配... 目录一、概述二、入门2.1 POM依赖2.2 编写配置类2.3 编写WebSocket服务2.4 浏

查询SQL Server数据库服务器IP地址的多种有效方法

《查询SQLServer数据库服务器IP地址的多种有效方法》作为数据库管理员或开发人员,了解如何查询SQLServer数据库服务器的IP地址是一项重要技能,本文将介绍几种简单而有效的方法,帮助你轻松... 目录使用T-SQL查询方法1:使用系统函数方法2:使用系统视图使用SQL Server Configu

C#使用DeepSeek API实现自然语言处理,文本分类和情感分析

《C#使用DeepSeekAPI实现自然语言处理,文本分类和情感分析》在C#中使用DeepSeekAPI可以实现多种功能,例如自然语言处理、文本分类、情感分析等,本文主要为大家介绍了具体实现步骤,... 目录准备工作文本生成文本分类问答系统代码生成翻译功能文本摘要文本校对图像描述生成总结在C#中使用Deep

nginx-rtmp-module构建流媒体直播服务器实战指南

《nginx-rtmp-module构建流媒体直播服务器实战指南》本文主要介绍了nginx-rtmp-module构建流媒体直播服务器实战指南,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有... 目录1. RTMP协议介绍与应用RTMP协议的原理RTMP协议的应用RTMP与现代流媒体技术的关系2

mysqld_multi在Linux服务器上运行多个MySQL实例

《mysqld_multi在Linux服务器上运行多个MySQL实例》在Linux系统上使用mysqld_multi来启动和管理多个MySQL实例是一种常见的做法,这种方式允许你在同一台机器上运行多个... 目录1. 安装mysql2. 配置文件示例配置文件3. 创建数据目录4. 启动和管理实例启动所有实例