NVIDIA RTX A6000/RTX3090/3080/3070深度学习训练/GPU服务器硬件配置推荐2021

本文主要是介绍NVIDIA RTX A6000/RTX3090/3080/3070深度学习训练/GPU服务器硬件配置推荐2021,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

本方案中,推荐配置报价更新日期:2021/03/06

变更原因:

1)近期唯利是图的厂家将RTX显卡大部分卖给挖矿的,造成断货、暴涨

2)RTX A6000上市、增加新GPU配置方案

3)GX630M保证6块GPU卡全部在Pcie 16X(6个 16x)带宽,而不是市场其他品牌机型是4个16x+2个8x

 

nvidia的 Ampere架构-RTX 3090上市,该卡是第一个拥有超1万个流处理器的最强算力GPU卡,由于该卡外形尺寸巨大,长度达313mm,厚度3个槽,另外功耗到350w,常规GPU计算机/工作站最多支持1~2块,市场上是否有支持更多RTX3090的硬件配置?
西安坤隆公司的UltraLAB GX630M深度学习工作站可支持到最大6块RTX3090卡或7块RTX3070,用于深度学习训练和推理,该配置的深度学习工作站的张量计算单元(Tensor Core)FP16性能理论达到1.7PTflops

(一)UltraLAB深度学习工作站支持RTX30情况

 

No

机型

关键配置

备注

1

GX380i

/GX390i

intel第9/10代高频

(8核@5Ghz-10核5.2GHz)

最大2块RTX30系列

内存最大128GB

静音级

2块RTX3090性能超4块Titan RTX,

2块RTX3080性能超4块RTX2080ti

2

GT410P

intel第10代至尊处理器

(10核4.6GHz-18核4.2GHz),

内存最大256GB

最大5块RTX30系列,

20个硬盘位

静音级

4块RTX3080性能超7块Titan RTX和8块2080Ti

3

GX630M

2颗Xeon(最大56核)

最大6-7块RTX30系列

20个硬盘位

静音级

是目前具有最高GPU算力的工作站


UltraLAB深度学习工作站-GPU配备规格

下表是UltraLAB深度学习机型可供配置组合(按最高性能指标降序)

 

No

型号

卡数

CUDA核数

FP32 (单位Tflops)

张量计算FP16(单位Tflops)

显存带宽GBs

显存合计GB

应用推荐

 

1

A6000

7

75264

280

2184

768

336

CNN+RNN

2

RTX3090

7

73472

249

1995

936

168

CNN+RNN

3

A6000

6

64512

240

1872

768

288

CNN+RNN

4

RTX3080

8

69632

238

1904

760

80

CNN

5

Tesla V100

16

81920

238

1760

653

192

CNN+RNN

6

RTX3090

6

62976

213

1710

936

144

CNN+RNN

7

RTX3080

6

52224

179

1428

760

60

CNN

8

RTX3090

5

52480

178

1425

936

120

CNN+RNN

9

A6000

4

83968

160

1248

768

192

CNN+RNN

10

RTX3080

5

43520

149

1190

760

50

CNN

11

RTX3090

4

41984

142

1140

936

96

CNN+RNN

12

RTX3070

7

41216

142

1141

448

56

CNN

13

RTX2080Ti

9

39168

121

990

616

99

CNN

14

RTX3070

6

35328

122

978

448

48

CNN

15

RTX3080

4

34816

119

952

760

40

CNN

16

Titan RTX

7

32256

114

910

672

168

CNN+RNN

17

RTX2080Ti

8

34816

108

880

616

88

CNN

18

RTX3090

3

41984

107

855

936

72

CNN+RNN

19

RTX3070

5

29440

102

815

448

40

CNN

20

RTX3080

3

34816

89

714

760

40

CNN

21

RTX3070

4

23552

81

652

448

32

CNN

22

A6000

2

21504

80

624

768

96

CNN+RNN

23

RTX3090

2

20992

71

570

936

48

CNN+RNN

24

Titan RTX

4

18432

65

520

672

96

CNN+RNN

25

RTX3070

3

23552

61

489

448

24

CNN

26

RTX3080

2

17408

60

476

760

20

CNN

27

RTX2080Ti

4

17408

54

440

616

44

CNN

28

RTX2080s

4

12288

44

252

496

32

CNN

29

RTX3070

2

11776

41

326

448

16

CNN

30

A6000

1

10752

40

312

768

48

CNN+RNN

31

RTX3090

1

10496

36

285

936

24

CNN+RNN

32

Titan RTX

2

9216

32

260

672

48

CNN+RNN

33

RTX3080

1

8704

30

238

760

10

CNN

34

RTX2080Ti

2

8704

28

220

616

22

CNN

35

RTX2080s

2

3072

22

126

496

16

CNN

36

RTX3070

1

5888

20

163

448

8

CNN

37

Titan RTX

1

4608

16

130

672

24

CNN+RNN

38

TITAN V

1

5120

14.90

110

652.80

12

 

39

RTX2080Ti

1

4352

13

110

616

11

CNN

 

 

从上述表格看:

(1) 6块RTX3090(6个全pcie 16x)已经接近nvidia DGX-2性能

(2) 4块RTX3090性能超9块RTX2080Ti或7块Titan RTX

(3)2块RTX3080性能超4块Titan RTX

(二)UltraLAB 深度学习工作站配置方案2020v4

2.1 图灵超算工作站GX380i配置方案-科研型

 

GX480i-01.jpg

 

No

产品型号

主要配置

显存

CUDA处理器FP16性能指标

单位:Tflops

张量处理器FP16性能指标

单位:Tflops

理想算法

价格

1.1

UltraLAB GX380i 14932-SAX

intel第9代处理器(6核@4.9Ghz) /32GB DDR4/RTX3080 10GB/960GB SSD /4TB SATA/双塔式(2000w) /23"图显

10GB

30

238

CNNRNN

¥35,500

1.2

UltraLAB GX380i 14932-SBT

intel第9代处理器(8核@4.9Ghz) /32GB DDR4/

RTX3090 24GB/1.9TB SSD /8TB SATA/双塔式(2000w) /23"图显

24GB

36

285

CNNRNN

¥49,990

1.3

UltraLAB GX380i 14932-SA2X

intel第9代处理器(8核@4.9Ghz ) /32GB DDR4 /2*RTX3070/1.9TB SSD /6TB SATA/双塔式(2000w)/23"图显

16GB

41

326

CNN

¥49,990

1.4

UltraLAB GX390i 15064-SB2X

intel第10代处理器(10核@5.0Ghz) /64GB DDR4 /2*RTX3080/1.9TB SSD /6TB SATA/双塔式(2000w)/23"图显

20GB

60

476

CNN

¥62,600

1.5

UltraLAB GX390i 15096-SC2T

intel第10代处理器(10核5.0Ghz) /96GB DDR4 /2*RTX3090/3.84TB SSD /8TB SATA/双塔式(2000w)/23"图显

48GB

71

570

CNNRNN

¥79,990

1.6UltraLAB GX390i 15096-SC2E

intel第10代处理器(10核5.0Ghz) /96GB DDR4 /2*A6000/3.84TB SSD /8TB SATA/双塔式(2000w)/23"图显

96GB80624

CNNRNN

¥145,000


2.2 图灵超算工作站(GT410P)配置推荐-高性能型
 

GX490M-4.jpg

 

No

产品型号

主要配置

显存

CUDA处理器FP16性能指标

单位:Tflops

张量处理器FP16性能指标

单位:Tflops

理想算法

价格

2.1

UltraLAB GT410P 14664-MB4X

intel第10代至尊处理器

(10核4.6Ghz )、64GB DDR4 /4*RTX3070/2TB SSD M2.SSD +6TB SATA/双塔式(双2000w) /27"-4K图显

32GB

81

652

CNN

¥94,500

2.2

UltraLAB GT410P 14596-MB5X

intel第10代至尊处理器

(12核4.5Ghz )、96GB DDR4 /5*RTX3070/2TB SSD M2.SSD +8TB SATA/双塔式(双2000w) /27"-4K图显

40GB

102

815

CNN

¥110,000

2.3

UltraLAB GT410P 145128-PC3T

intel第10代至尊处理器

(12核4.5Ghz )、128GB DDR4 /3*RTX3090/ 4TB Pci-SSD+ 10TB SATA/ 双塔式(双2000w)/27"-4K图显

72GB

107

855

CNNRNN

¥135,000

2.4

UltraLAB GT410P 14596-PC4X

intel第10代至尊处理器

(12核4.5Ghz )、96GB DDR4 /4*RTX3080/4TB Pci-SSD+ 10TB SATA/双塔式(双2000w) /27"-4K图显

40GB

119

952

CNN

¥119,000

2.5

UltraLAB GT410P 144192-PC4T

intel第10代至尊处理器

(14核4.4Ghz )、192GB DDR4 /4*RTX30904TB Pci-SSD+ 12TB SATA/双塔式(双2000w) /27"-4K图显

96GB

142

1140

CNNRNN

¥159,990

2.6

UltraLAB GT410P 144128-PC5X

intel第10代至尊处理器

(14核4.4Ghz )、128GB DDR4 /5*RTX3080/4TB Pci-SSD+ 10TB SATA/双塔式(双2000w) /27"-4K图显

50GB

149

1190

CNN

¥139,990

2.7

UltraLAB GT410P 144256-PD5T

intel第10代至尊处理器

(14核4.4Ghz)、256GB DDR4 /5*RTX3090/6.4TB Pci-SSD+ 12TB SATA/双塔式(双2000w) /27"-4K图显

120GB

178

1425

CNNRNN

¥185,000

2.8UltraLAB GT410P 144256-PD5E

intel第10代至尊处理器

(14核4.4Ghz)、256GB DDR4 /5*A6000/6.4TB Pci-SSD+ 12TB SATA/双塔式(双2000w) /27"-4K图显

240GB2001560

CNNRNN

¥335,000

 


2.3 图灵超算工作站(GX630M)配置推荐-极致型

 

GX480M-02D1.jpg

 

No

产品型号

主要配置

显存

CUDA处理器FP16性能指标

单位:Tflops

张量处理器FP16性能指标

单位:Tflops

理想算法

价格

3.1

UltraLAB GX630M 243192-MB6X

2*Xeon金6244(16核4.3GHz)/睿频4.4GHz/192GB DDR4 /6*RTX3070 /1.92TB SSD+2TB M2.SSD/42TB存储/双塔式(双2000w)/27"-4K图显

48GB

122

978

CNN

¥199,990

3.2

UltraLAB GX630M 243256-MB7X

2*Xeon金6244(16核4.3GHz)/睿频4.4GHz/192GB DDR4 /7*RTX3070 /1.92TB SSD+2TB M2.SSD/56TB存储/双塔式(双2000w)/27"-4K图显

56GB

142

1141

CNN

¥220,000

3.3

ltraLAB GX630M 243256-PC5X

2*Xeon金6244(16核4.3GHz)/睿频4.4GHz/256GB DDR4 /5*RTX3080 /1.92TB SSD+4TB P-SSD/70TB存储/双塔式(双2000w)/27"-4K图显

50GB

149

1190

CNN

¥223,000

3.4UltraLAB GX630M 241384-PC6X

2*Xeon金6246(24核4.1GHz)/睿频4.2GHz /384GB DDR4 /6*RTX3080 /1.9TB SSD+4TB P-SSD/70TB并行存储/双塔式(双2000w)/27"-4K图显

60GB1791428CNN¥248,000

3.5

UltraLAB GX630M 243192-MB4T

2*Xeon金6244(16核4.3GHz)/睿频4.3GHz/192GB DDR4 /4*RTX3090 /1.9TB SSD+2TB M2.SSD/56TB存储/双塔式(双2000w)/27"-4K图显

96GB1421140

CNNRNN

¥256,000

3.6

UltraLAB GX630M 241384-PD5T2*Xeon金6246(24核4.1GHz)/睿频4.2GHz /384GB DDR4 /5*RTX3090 /1.92TB SSD+4TB P-SSD/90TB并行存储/双塔/27"-4K图120GB1781425

CNNRNN

¥299,000

3.7

UltraLAB GX630M 243768-180T6T

2*Xeon金6256(24核4.3GHz)/   睿频4.5GHz /768GB DDR4 /6*RTX3090(三槽)/3.84TB SSD +180TB并行存储/双塔式(双2000w)/32"-4K图显

144GB

213

1710

性能近16块Titan V

¥375,000

 3.8UltraLAB GX630M 243768-180T7T

2*Xeon金6256(24核4.3GHz)/   睿频4.5GHz /768GB DDR4 /7*RTX3090(双槽)/4TB P-SSD +180TB并行存储/双塔式(双2000w)/32"-4K图显

168GB2491990

最快最完美,性能超DGX-2

 ¥399,900
 3.9UltraLAB GX630M 243384-150T4E

2*Xeon金6256(24核4.3GHz)/睿频4.5GHz /384GB DDR4 /4*A6000  /4TB P-SSD+150TB并行存储/双塔式(双2000w)/32"-4K图显

192GB1601250

CNN+  RNN+  推理

 ¥399,900

3.10

UltraLAB GX630M 2331T-150T7E

2*Xeon金6254(36核3.9GHz)/睿频4.0GHz/1TB DDR4 /7*A6000 /双3.84TB SSD+6.4TB-P-SSD/240TB 并行存储/双塔式(双2000w) /32"-4K图显

336GB

280

2180

最强最完整

¥650,000

 

上述配置可以看出:

(1)UltraLAB GX630M大部分配置都已超越9块RTX2080ti/7块Titan RTX性能

(2)UltraLAB GX630M(编号3.7)的配置规格,其性能已经接近nvidia DGX-2,但其价格是DGX-2的1/10价格

 

欢迎测试验证

 

 

这篇关于NVIDIA RTX A6000/RTX3090/3080/3070深度学习训练/GPU服务器硬件配置推荐2021的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/757101

相关文章

HarmonyOS学习(七)——UI(五)常用布局总结

自适应布局 1.1、线性布局(LinearLayout) 通过线性容器Row和Column实现线性布局。Column容器内的子组件按照垂直方向排列,Row组件中的子组件按照水平方向排列。 属性说明space通过space参数设置主轴上子组件的间距,达到各子组件在排列上的等间距效果alignItems设置子组件在交叉轴上的对齐方式,且在各类尺寸屏幕上表现一致,其中交叉轴为垂直时,取值为Vert

Ilya-AI分享的他在OpenAI学习到的15个提示工程技巧

Ilya(不是本人,claude AI)在社交媒体上分享了他在OpenAI学习到的15个Prompt撰写技巧。 以下是详细的内容: 提示精确化:在编写提示时,力求表达清晰准确。清楚地阐述任务需求和概念定义至关重要。例:不用"分析文本",而用"判断这段话的情感倾向:积极、消极还是中性"。 快速迭代:善于快速连续调整提示。熟练的提示工程师能够灵活地进行多轮优化。例:从"总结文章"到"用

不懂推荐算法也能设计推荐系统

本文以商业化应用推荐为例,告诉我们不懂推荐算法的产品,也能从产品侧出发, 设计出一款不错的推荐系统。 相信很多新手产品,看到算法二字,多是懵圈的。 什么排序算法、最短路径等都是相对传统的算法(注:传统是指科班出身的产品都会接触过)。但对于推荐算法,多数产品对着网上搜到的资源,都会无从下手。特别当某些推荐算法 和 “AI”扯上关系后,更是加大了理解的难度。 但,不了解推荐算法,就无法做推荐系

服务器集群同步时间手记

1.时间服务器配置(必须root用户) (1)检查ntp是否安装 [root@node1 桌面]# rpm -qa|grep ntpntp-4.2.6p5-10.el6.centos.x86_64fontpackages-filesystem-1.41-1.1.el6.noarchntpdate-4.2.6p5-10.el6.centos.x86_64 (2)修改ntp配置文件 [r

Zookeeper安装和配置说明

一、Zookeeper的搭建方式 Zookeeper安装方式有三种,单机模式和集群模式以及伪集群模式。 ■ 单机模式:Zookeeper只运行在一台服务器上,适合测试环境; ■ 伪集群模式:就是在一台物理机上运行多个Zookeeper 实例; ■ 集群模式:Zookeeper运行于一个集群上,适合生产环境,这个计算机集群被称为一个“集合体”(ensemble) Zookeeper通过复制来实现

CentOS7安装配置mysql5.7 tar免安装版

一、CentOS7.4系统自带mariadb # 查看系统自带的Mariadb[root@localhost~]# rpm -qa|grep mariadbmariadb-libs-5.5.44-2.el7.centos.x86_64# 卸载系统自带的Mariadb[root@localhost ~]# rpm -e --nodeps mariadb-libs-5.5.44-2.el7

hadoop开启回收站配置

开启回收站功能,可以将删除的文件在不超时的情况下,恢复原数据,起到防止误删除、备份等作用。 开启回收站功能参数说明 (1)默认值fs.trash.interval = 0,0表示禁用回收站;其他值表示设置文件的存活时间。 (2)默认值fs.trash.checkpoint.interval = 0,检查回收站的间隔时间。如果该值为0,则该值设置和fs.trash.interval的参数值相等。

NameNode内存生产配置

Hadoop2.x 系列,配置 NameNode 内存 NameNode 内存默认 2000m ,如果服务器内存 4G , NameNode 内存可以配置 3g 。在 hadoop-env.sh 文件中配置如下。 HADOOP_NAMENODE_OPTS=-Xmx3072m Hadoop3.x 系列,配置 Nam

【前端学习】AntV G6-08 深入图形与图形分组、自定义节点、节点动画(下)

【课程链接】 AntV G6:深入图形与图形分组、自定义节点、节点动画(下)_哔哩哔哩_bilibili 本章十吾老师讲解了一个复杂的自定义节点中,应该怎样去计算和绘制图形,如何给一个图形制作不间断的动画,以及在鼠标事件之后产生动画。(有点难,需要好好理解) <!DOCTYPE html><html><head><meta charset="UTF-8"><title>06

学习hash总结

2014/1/29/   最近刚开始学hash,名字很陌生,但是hash的思想却很熟悉,以前早就做过此类的题,但是不知道这就是hash思想而已,说白了hash就是一个映射,往往灵活利用数组的下标来实现算法,hash的作用:1、判重;2、统计次数;