Ubuntu 20.04 for NVIDIA V100 GPU安装手册

2023-12-01 12:15

本文主要是介绍Ubuntu 20.04 for NVIDIA V100 GPU安装手册,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

安装Ubuntu 20.04.3 LTS版本

image.png

image.png

安装Ubuntu 20.04按照安装提示,仔细选择每一项,基本默认即可。

系统中查看GPU信息

系统安装完成之后,进入系统,使用lspci 命令查询一下GPU是否存在、型号信息是什么。

bpang@bobpang:\~$ sudo lspci |grep -i nvidia

2f:00.0 3D controller: NVIDIA Corporation GV100GL [Tesla V100 PCIe 16GB] (rev a1)

86:00.0 3D controller: NVIDIA Corporation GV100GL [Tesla V100 PCIe 16GB] (rev a1)

下载NVIDIA Tesla V100驱动

通过lspci查询到GPU的型号之后,可以按照如下选择,选择产品类型、系列、型号、然后根据自己的操作系统来选择。

注意:如果操作系统是Linux,尽量选择Linux 32-bit/Linux 64-bit,不需要选择详细的Linux发行版本。测试是发现选择详细的Linux发行版本,安装驱动之后,找不到nvidia-smi命令。

image.png

image.png

image.png

image.png

安装gcc等依赖包

当安装GPU驱动时,提示缺少相关的依赖包,在此,我们需要提前安装相关的依赖包,目前需要用到的是gcc , g++ , make :

bpang@bobpang:\~$ sudo apt install gcc g++ make

屏蔽nouveau开源版本的GPU驱动

当系统安装完成之后,会安装系统开源的NVIDIA驱动版本,名称为nouveau。下面将屏蔽该驱动。

首先,创建/etc/modprobe.d/blacklist-nouveau.conf文件,

bpang@bobpang:\~$ sudo vim /etc/modprobe.d/blacklist-nouveau.conf

将下面内容添加进去:

blacklist nouveau

blacklist lbm-nouveau

options nouveau modeset=0

alias nouveau off

alias lbm-nouveau off

创建/etc/modprobe.d/nouveau-kms.conf文件,将options nouveau mdeset=0添加进去:

bpang@bobpang:\~$ echo options nouveau modeset=0 | sudo tee -a /etc/modprobe.d/nouveau-kms.conf

更新一下initramfs:

bpang@bobpang:\~$ sudo update-initramfs -u

重启服务器:

bpang@bobpang:\~$ sudo reboot

查看nouveau模块是否加载,不显示的话就表示已经禁用:

bpang@bobpang:\~$ sudo lsmod | grep nouveau

image.png

image.png

安装NVIDIA GPU驱动

安装下载的GPU驱动:NVIDIA-Linux-x86\_64-510.47.03.run ,目前驱动版本为:510.47.03,如下执行该驱动文件,即可安装。

bpang@bobpang:\~$ ./ NVIDIA-Linux-x86\_64-510.47.03.run

安装完成之后,可以使用lspci看到GPU的驱动信息:

image.png

image.png

使用nvidia-smi命令查看GPU的信息

bpang@bobpang:\~$ nvidia-smi

image.png

image.png

安装CUDA 11.6

访问nvidia官网,下载CUDA,cuda的链接为:CUDA Toolkit 12.3 Update 1 Downloads | NVIDIA Developer

选择runfile文件来安装。

image.png

image.png

bpang@bobpang:\~$ wget https://developer.download.nvidia.com/compute/cuda/11.6.0/local\_installers/cuda\_11.6.0\_510.39.01\_linux.run

bpang@bobpang:\~$ sudo sh cuda\_11.6.0\_510.39.01\_linux.run

如下图,Driver选项不要勾选了,前面已经安装GPU驱动了。

image.png

image.png

image.png

image.png

创建环境变量,编辑\~/.bashrc文件:

bpang@bobpang:/data/cuda$ vim \~/.bashrc

将下面命令追加到文件最后面:

export CUDA\_HOME=/usr/local/cuda

export PATH=$PATH:$CUDA\_HOME/bin

export LD\_LIBRARY\_PATH=/usr/local/cuda-11.6/lib64${LD\_LIBRARY\_PATH:+:${LD\_LIBRARY\_PATH}}

为nvcc命令创建一个软连接到/usr/bin目录:

bpang@bobpang:/data/cuda$ sudo ln -s /usr/local/cuda/bin/nvcc /usr/bin/nvcc

使用nvcc命令查看cuda的版本:

bpang@bobpang:/data/cuda$ nvcc --version

image.png

image.png

验证CUDA是否安装成功

下载CUD实例文件。因为CUDA 11.6版本中 /usr/local/cuda/samples里面没有实例文件,只有一个README文件,内容中告诉你需要从github下载,因为github太慢,所以从gitee中下载实例文件:

bpang@bobpang:\~$ git clone liwuhao/cuda-samples

bpang@bobpang:\~$ mv cuda-samples/Samples/* /usr/local/cuda/samples/*

bpang@bobpang:\~$ cd /usr/local/cuda/samples/1\_Utilities/deviceQuery

$ sudo make

$ ./deviceQuery

image.png

image.png

image.png

image.png

安装cuDNN

CUDA Deep Neural Network (cuDNN) | NVIDIA Developer 从官网下载cudnn

image.png

image.png

image.png

image.png

下载的文件名为:cudnn-linux-x86\_64-8.3.2.44\_cuda11.5-archive.tar.xz

文件拷贝到服务器。然后安装:

bpang@bobpang:/data$ tar xvf cudnn-linux-x86\_64-8.3.2.44\_cuda11.5-archive.tar.xz

bpang@bobpang:\~$ cd /usr/local/cuda

bpang@bobpang:/usr/local/cuda$ sudo cp -p /data/cudnn-linux-x86\_64-8.3.2.44\_cuda11.5-archive/include/cudnn*.h include/

bpang@bobpang:/usr/local/cuda$ sudo cp -p /data/cudnn-linux-x86\_64-8.3.2.44\_cuda11.5-archive/lib/libcudnn* lib64/

bpang@bobpang:\~$ sudo chmod a+r /usr/local/cuda-11.6/include/cudnn.h

bpang@bobpang:\~$ sudo chmod a+r /usr/local/cuda-11.6/lib64/libcudnn*

Centos 7 安装V100 驱动

1. 安装依赖环境

yum install kernel-devel gcc -y

一定要确保kernel-devel版本和系统kernel版本一样,否则后期安装驱动会出现问题

2. 屏蔽系统自带的nouveau

[root@localhost home]# vi /lib/modprobe.d/dist-blacklist.conf

修改dist-blacklist.conf文件:

vim /lib/modprobe.d/dist-blacklist.conf

将nvidiafb注释掉:

\#blacklist nvidiafb

然后添加以下语句:

blacklist nouveau

options nouveau modeset=0

屏蔽前:

image.png

image.png

系统重启后,如果屏蔽成功后,显示未:

image.png

image.png

3. 重建initramfs image

mv /boot/initramfs-$(uname -r).img /boot/initramfs-$(uname -r).img.bak

dracut /boot/initramfs-$(uname -r).img $(uname -r)

image.png

image.png

4.修改运行级别为文本模式

systemctl set-default multi-user.target

image.png

image.png

5.重启系统

版权说明

转载请注明365文档,更多技术文档请访问365文档

这篇关于Ubuntu 20.04 for NVIDIA V100 GPU安装手册的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/441113

相关文章

mac安装nvm(node.js)多版本管理实践步骤

《mac安装nvm(node.js)多版本管理实践步骤》:本文主要介绍mac安装nvm(node.js)多版本管理的相关资料,NVM是一个用于管理多个Node.js版本的命令行工具,它允许开发者在... 目录NVM功能简介MAC安装实践一、下载nvm二、安装nvm三、安装node.js总结NVM功能简介N

python安装whl包并解决依赖关系的实现

《python安装whl包并解决依赖关系的实现》本文主要介绍了python安装whl包并解决依赖关系的实现,文中通过图文示例介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面... 目录一、什么是whl文件?二、我们为什么需要使用whl文件来安装python库?三、我们应该去哪儿下

MySQL安装时initializing database失败的问题解决

《MySQL安装时initializingdatabase失败的问题解决》本文主要介绍了MySQL安装时initializingdatabase失败的问题解决,文中通过图文介绍的非常详细,对大家的学... 目录问题页面:解决方法:问题页面:解决方法:1.勾选红框中的选项:2.将下图红框中全部改为英

MySQL9.0默认路径安装下重置root密码

《MySQL9.0默认路径安装下重置root密码》本文主要介绍了MySQL9.0默认路径安装下重置root密码,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们... 目录问题描述环境描述解决方法正常模式下修改密码报错原因问题描述mysqlChina编程采用默认安装路径,

Python使用国内镜像加速pip安装的方法讲解

《Python使用国内镜像加速pip安装的方法讲解》在Python开发中,pip是一个非常重要的工具,用于安装和管理Python的第三方库,然而,在国内使用pip安装依赖时,往往会因为网络问题而导致速... 目录一、pip 工具简介1. 什么是 pip?2. 什么是 -i 参数?二、国内镜像源的选择三、如何

Ubuntu固定虚拟机ip地址的方法教程

《Ubuntu固定虚拟机ip地址的方法教程》本文详细介绍了如何在Ubuntu虚拟机中固定IP地址,包括检查和编辑`/etc/apt/sources.list`文件、更新网络配置文件以及使用Networ... 1、由于虚拟机网络是桥接,所以ip地址会不停地变化,接下来我们就讲述ip如何固定 2、如果apt安

Python安装时常见报错以及解决方案

《Python安装时常见报错以及解决方案》:本文主要介绍在安装Python、配置环境变量、使用pip以及运行Python脚本时常见的错误及其解决方案,文中介绍的非常详细,需要的朋友可以参考下... 目录一、安装 python 时常见报错及解决方案(一)安装包下载失败(二)权限不足二、配置环境变量时常见报错及

MySQL8.2.0安装教程分享

《MySQL8.2.0安装教程分享》这篇文章详细介绍了如何在Windows系统上安装MySQL数据库软件,包括下载、安装、配置和设置环境变量的步骤... 目录mysql的安装图文1.python访问网址2javascript.点击3.进入Downloads向下滑动4.选择Community Server5.

CentOS系统Maven安装教程分享

《CentOS系统Maven安装教程分享》本文介绍了如何在CentOS系统中安装Maven,并提供了一个简单的实际应用案例,安装Maven需要先安装Java和设置环境变量,Maven可以自动管理项目的... 目录准备工作下载并安装Maven常见问题及解决方法实际应用案例总结Maven是一个流行的项目管理工具

MySql9.1.0安装详细教程(最新推荐)

《MySql9.1.0安装详细教程(最新推荐)》MySQL是一个流行的关系型数据库管理系统,支持多线程和多种数据库连接途径,能够处理上千万条记录的大型数据库,本文介绍MySql9.1.0安装详细教程,... 目录mysql介绍:一、下载 Mysql 安装文件二、Mysql 安装教程三、环境配置1.右击此电脑