Ubuntu 20.04 for NVIDIA V100 GPU安装手册

2023-12-01 12:15

本文主要是介绍Ubuntu 20.04 for NVIDIA V100 GPU安装手册,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

安装Ubuntu 20.04.3 LTS版本

image.png

image.png

安装Ubuntu 20.04按照安装提示,仔细选择每一项,基本默认即可。

系统中查看GPU信息

系统安装完成之后,进入系统,使用lspci 命令查询一下GPU是否存在、型号信息是什么。

bpang@bobpang:\~$ sudo lspci |grep -i nvidia

2f:00.0 3D controller: NVIDIA Corporation GV100GL [Tesla V100 PCIe 16GB] (rev a1)

86:00.0 3D controller: NVIDIA Corporation GV100GL [Tesla V100 PCIe 16GB] (rev a1)

下载NVIDIA Tesla V100驱动

通过lspci查询到GPU的型号之后,可以按照如下选择,选择产品类型、系列、型号、然后根据自己的操作系统来选择。

注意:如果操作系统是Linux,尽量选择Linux 32-bit/Linux 64-bit,不需要选择详细的Linux发行版本。测试是发现选择详细的Linux发行版本,安装驱动之后,找不到nvidia-smi命令。

image.png

image.png

image.png

image.png

安装gcc等依赖包

当安装GPU驱动时,提示缺少相关的依赖包,在此,我们需要提前安装相关的依赖包,目前需要用到的是gcc , g++ , make :

bpang@bobpang:\~$ sudo apt install gcc g++ make

屏蔽nouveau开源版本的GPU驱动

当系统安装完成之后,会安装系统开源的NVIDIA驱动版本,名称为nouveau。下面将屏蔽该驱动。

首先,创建/etc/modprobe.d/blacklist-nouveau.conf文件,

bpang@bobpang:\~$ sudo vim /etc/modprobe.d/blacklist-nouveau.conf

将下面内容添加进去:

blacklist nouveau

blacklist lbm-nouveau

options nouveau modeset=0

alias nouveau off

alias lbm-nouveau off

创建/etc/modprobe.d/nouveau-kms.conf文件,将options nouveau mdeset=0添加进去:

bpang@bobpang:\~$ echo options nouveau modeset=0 | sudo tee -a /etc/modprobe.d/nouveau-kms.conf

更新一下initramfs:

bpang@bobpang:\~$ sudo update-initramfs -u

重启服务器:

bpang@bobpang:\~$ sudo reboot

查看nouveau模块是否加载,不显示的话就表示已经禁用:

bpang@bobpang:\~$ sudo lsmod | grep nouveau

image.png

image.png

安装NVIDIA GPU驱动

安装下载的GPU驱动:NVIDIA-Linux-x86\_64-510.47.03.run ,目前驱动版本为:510.47.03,如下执行该驱动文件,即可安装。

bpang@bobpang:\~$ ./ NVIDIA-Linux-x86\_64-510.47.03.run

安装完成之后,可以使用lspci看到GPU的驱动信息:

image.png

image.png

使用nvidia-smi命令查看GPU的信息

bpang@bobpang:\~$ nvidia-smi

image.png

image.png

安装CUDA 11.6

访问nvidia官网,下载CUDA,cuda的链接为:CUDA Toolkit 12.3 Update 1 Downloads | NVIDIA Developer

选择runfile文件来安装。

image.png

image.png

bpang@bobpang:\~$ wget https://developer.download.nvidia.com/compute/cuda/11.6.0/local\_installers/cuda\_11.6.0\_510.39.01\_linux.run

bpang@bobpang:\~$ sudo sh cuda\_11.6.0\_510.39.01\_linux.run

如下图,Driver选项不要勾选了,前面已经安装GPU驱动了。

image.png

image.png

image.png

image.png

创建环境变量,编辑\~/.bashrc文件:

bpang@bobpang:/data/cuda$ vim \~/.bashrc

将下面命令追加到文件最后面:

export CUDA\_HOME=/usr/local/cuda

export PATH=$PATH:$CUDA\_HOME/bin

export LD\_LIBRARY\_PATH=/usr/local/cuda-11.6/lib64${LD\_LIBRARY\_PATH:+:${LD\_LIBRARY\_PATH}}

为nvcc命令创建一个软连接到/usr/bin目录:

bpang@bobpang:/data/cuda$ sudo ln -s /usr/local/cuda/bin/nvcc /usr/bin/nvcc

使用nvcc命令查看cuda的版本:

bpang@bobpang:/data/cuda$ nvcc --version

image.png

image.png

验证CUDA是否安装成功

下载CUD实例文件。因为CUDA 11.6版本中 /usr/local/cuda/samples里面没有实例文件,只有一个README文件,内容中告诉你需要从github下载,因为github太慢,所以从gitee中下载实例文件:

bpang@bobpang:\~$ git clone liwuhao/cuda-samples

bpang@bobpang:\~$ mv cuda-samples/Samples/* /usr/local/cuda/samples/*

bpang@bobpang:\~$ cd /usr/local/cuda/samples/1\_Utilities/deviceQuery

$ sudo make

$ ./deviceQuery

image.png

image.png

image.png

image.png

安装cuDNN

CUDA Deep Neural Network (cuDNN) | NVIDIA Developer 从官网下载cudnn

image.png

image.png

image.png

image.png

下载的文件名为:cudnn-linux-x86\_64-8.3.2.44\_cuda11.5-archive.tar.xz

文件拷贝到服务器。然后安装:

bpang@bobpang:/data$ tar xvf cudnn-linux-x86\_64-8.3.2.44\_cuda11.5-archive.tar.xz

bpang@bobpang:\~$ cd /usr/local/cuda

bpang@bobpang:/usr/local/cuda$ sudo cp -p /data/cudnn-linux-x86\_64-8.3.2.44\_cuda11.5-archive/include/cudnn*.h include/

bpang@bobpang:/usr/local/cuda$ sudo cp -p /data/cudnn-linux-x86\_64-8.3.2.44\_cuda11.5-archive/lib/libcudnn* lib64/

bpang@bobpang:\~$ sudo chmod a+r /usr/local/cuda-11.6/include/cudnn.h

bpang@bobpang:\~$ sudo chmod a+r /usr/local/cuda-11.6/lib64/libcudnn*

Centos 7 安装V100 驱动

1. 安装依赖环境

yum install kernel-devel gcc -y

一定要确保kernel-devel版本和系统kernel版本一样,否则后期安装驱动会出现问题

2. 屏蔽系统自带的nouveau

[root@localhost home]# vi /lib/modprobe.d/dist-blacklist.conf

修改dist-blacklist.conf文件:

vim /lib/modprobe.d/dist-blacklist.conf

将nvidiafb注释掉:

\#blacklist nvidiafb

然后添加以下语句:

blacklist nouveau

options nouveau modeset=0

屏蔽前:

image.png

image.png

系统重启后,如果屏蔽成功后,显示未:

image.png

image.png

3. 重建initramfs image

mv /boot/initramfs-$(uname -r).img /boot/initramfs-$(uname -r).img.bak

dracut /boot/initramfs-$(uname -r).img $(uname -r)

image.png

image.png

4.修改运行级别为文本模式

systemctl set-default multi-user.target

image.png

image.png

5.重启系统

版权说明

转载请注明365文档,更多技术文档请访问365文档

这篇关于Ubuntu 20.04 for NVIDIA V100 GPU安装手册的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/441113

相关文章

python管理工具之conda安装部署及使用详解

《python管理工具之conda安装部署及使用详解》这篇文章详细介绍了如何安装和使用conda来管理Python环境,它涵盖了从安装部署、镜像源配置到具体的conda使用方法,包括创建、激活、安装包... 目录pytpshheraerUhon管理工具:conda部署+使用一、安装部署1、 下载2、 安装3

龙蜥操作系统Anolis OS-23.x安装配置图解教程(保姆级)

《龙蜥操作系统AnolisOS-23.x安装配置图解教程(保姆级)》:本文主要介绍了安装和配置AnolisOS23.2系统,包括分区、软件选择、设置root密码、网络配置、主机名设置和禁用SELinux的步骤,详细内容请阅读本文,希望能对你有所帮助... ‌AnolisOS‌是由阿里云推出的开源操作系统,旨

怎么关闭Ubuntu无人值守升级? Ubuntu禁止自动更新的技巧

《怎么关闭Ubuntu无人值守升级?Ubuntu禁止自动更新的技巧》UbuntuLinux系统禁止自动更新的时候,提示“无人值守升级在关机期间,请不要关闭计算机进程”,该怎么解决这个问题?详细请看... 本教程教你如何处理无人值守的升级,即 Ubuntu linux 的自动系统更新。来源:https://

Ubuntu系统怎么安装Warp? 新一代AI 终端神器安装使用方法

《Ubuntu系统怎么安装Warp?新一代AI终端神器安装使用方法》Warp是一款使用Rust开发的现代化AI终端工具,该怎么再Ubuntu系统中安装使用呢?下面我们就来看看详细教程... Warp Terminal 是一款使用 Rust 开发的现代化「AI 终端」工具。最初它只支持 MACOS,但在 20

mysql-8.0.30压缩包版安装和配置MySQL环境过程

《mysql-8.0.30压缩包版安装和配置MySQL环境过程》该文章介绍了如何在Windows系统中下载、安装和配置MySQL数据库,包括下载地址、解压文件、创建和配置my.ini文件、设置环境变量... 目录压缩包安装配置下载配置环境变量下载和初始化总结压缩包安装配置下载下载地址:https://d

LinuxMint怎么安装? Linux Mint22下载安装图文教程

《LinuxMint怎么安装?LinuxMint22下载安装图文教程》LinuxMint22发布以后,有很多新功能,很多朋友想要下载并安装,该怎么操作呢?下面我们就来看看详细安装指南... linux Mint 是一款基于 Ubuntu 的流行发行版,凭借其现代、精致、易于使用的特性,深受小伙伴们所喜爱。对

Linux(Centos7)安装Mysql/Redis/MinIO方式

《Linux(Centos7)安装Mysql/Redis/MinIO方式》文章总结:介绍了如何安装MySQL和Redis,以及如何配置它们为开机自启,还详细讲解了如何安装MinIO,包括配置Syste... 目录安装mysql安装Redis安装MinIO总结安装Mysql安装Redis搜索Red

python安装完成后可以进行的后续步骤和注意事项小结

《python安装完成后可以进行的后续步骤和注意事项小结》本文详细介绍了安装Python3后的后续步骤,包括验证安装、配置环境、安装包、创建和运行脚本,以及使用虚拟环境,还强调了注意事项,如系统更新、... 目录验证安装配置环境(可选)安装python包创建和运行Python脚本虚拟环境(可选)注意事项安装

gradle安装和环境配置全过程

《gradle安装和环境配置全过程》本文介绍了如何安装和配置Gradle环境,包括下载Gradle、配置环境变量、测试Gradle以及在IntelliJIDEA中配置Gradle... 目录gradle安装和环境配置1 下载GRADLE2 环境变量配置3 测试gradle4 设置gradle初始化文件5 i

在Ubuntu上部署SpringBoot应用的操作步骤

《在Ubuntu上部署SpringBoot应用的操作步骤》随着云计算和容器化技术的普及,Linux服务器已成为部署Web应用程序的主流平台之一,Java作为一种跨平台的编程语言,具有广泛的应用场景,本... 目录一、部署准备二、安装 Java 环境1. 安装 JDK2. 验证 Java 安装三、安装 mys