Linux安装CUDA+CUDNN+TRT+DS教程

2024-02-29 03:20
文章标签 linux 安装 教程 cuda cudnn ds trt

本文主要是介绍Linux安装CUDA+CUDNN+TRT+DS教程,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

Linux安装CUDA+CUDNN+TRT+DS教程

一、系统部署及环境部署(CUDA,CUDNN,TRT,Deepstream)

在进行系统部署及环境部署时,要注意各组件的版本号是否对应,如下图:

在这里插入图片描述

1.1 安装CUDA

(1)查看显卡驱动是否安装

nvidia-smi

在这里插入图片描述
可以看到显示出CUDA 的对应信息,表示驱动已经安装了,如果没有返回,可以安装时进行勾选。这一步一定要检查,不然后面会报错。

(2)下载CUDA并安装

CUDA下载地址:https://developer.nvidia.com/cuda-toolkit-archive

查找对应的CUDA版本,并勾选匹配自己电脑的信息,比如我的电脑是Linux系统,X86_64平台,ubuntu18.04,进行如下勾选:

在这里插入图片描述
有三种安装方式,我们选择第三种“runfile(local)”,下面会出现相应的安装方式,在命令行输入显示的命令,比如我这里显示的是:

>wget
https://developer.download.nvidia.com/compute/cuda/11.4.0/local_installers/cuda_11.4.0_470.42.01_linux.run
>sudo sh cuda_11.4.0_470.42.01_linux.run

第一步进行下载,第二步进行安装,一路输入“accept”,直到出现CUDA的安装页面,如下图:

在这里插入图片描述
如果没有驱动,则直接选择“Install”进行安装,如果安装了驱动,则把“Driver”勾选去掉,再进行安装。

等待一会,就可以了。

接下来进行环境配置(在root下进行)版本按自己来:

>vim ~/.bashrc  #修改环境变量
>export PATH=/usr/local/cuda-11.4/bin${PATH:+:${PATH}}   #添加CUDA路径
>export LD_LIBRARY_PATH=/usr/local/cuda-11.4/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
>source ~/.bashrc  #使之生效

测试是否安装成功:

nvcc -V

会出现一段信息:

在这里插入图片描述
这样就证明安装成功了。

(3)下载CUDNN并安装

CUDNN下载地址:https://developer.nvidia.com/rdp/cudnn-archive

这一步需要账号密码,登录后会出现所有版本的信息。

到这里需要注意版本的对应关系,在最上面可以看到,CUDA11.4对应的CUDNN要8.2+,所以在选择版本时,我们选择8.2+。比如我们选择8.2.4的版本。点击会出现以下界面:

在这里插入图片描述

这里我们选择第二个进行下载,也就是下载tgz包,下载完成后上传电脑,然后进行解压(自己的包),命令如下:

tar -xvf cudnn-11.4-linux-x64-v8.2.4.15.tgz

将CUDNN安装目录下部分文件复制到CUDA的安装目录下:

sudo cp cudnn-11.4-linux-x64-v8.2.4.15/include/cudnn*.h /usr/local/cuda/include 
sudo cp -P cudnn-11.4-linux-x64-v8.2.4.15/lib/libcudnn* /usr/local/cuda/lib64 

修改权限:

sudo chmod a+r /usr/local/cuda/include/cudnn*.h /usr/local/cuda/lib64/libcudnn*

通过以下命令查看CUDNN信息并测试是否成功:

cat /usr/local/cuda/include/cudnn_version.h
1.2 安装TRT

(1)下载TRT

TRT下载地址:https://developer.nvidia.com/nvidia-tensorrt-download

这里会显示所有历史版本,还是根据版本来,这里我们对应的是TRT8.0.1的(当然,一两个小版本是不会有影响,不用太执着,只需要满足最低需求就可以了)。点击后可以看到:

在这里插入图片描述

选择tgz包,进行下载,并上传至电脑。并进行解压。

tar zxf TensorRT-8.0.1.6.Linux.x86_64-gnu.cuda-11.3.cudnn8.2.tar.gz

放于一个好找的地方并重命名:

mv TensorRT-8.0.1.6 /opt

配置环境变量:

export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/opt/TensorRT-8.0.1.6/lib
source ~./bashrc #使之生效

将复制tensorRT目录下 lib、include文件夹到系统文件夹(或者将这两个文件夹路径添加到.bashrc文件中)

sudo cp -r ./lib/* /usr/lib
sudo cp -r ./include/* /user/include

(2)安装python-TRT

将TRT安装到python里面,这里我们进入目录进行安装:

cd /opt/TensorRT-8.0.1.6/python
pip install tensorrt-8.0.1.6-cp36-none-linux_x86_64.whl 

安装自己python对应的版本,当然这里尽量选择python3.6或者3.8版本,后面和deepstream的python-api是相匹配的,而且这两个版本也是较为常用且稳定的。

(3)测试python-TRT

打开python,并输入:

import tensorrt

没报错,证明成功。如果报错,可以根据安装时的报错进行解决(无非是缺了什么库,再装就行)。

1.2 安装Deepstream

(1)安装依赖

这一步比较重要,很多报错,可以通过清除依赖,以及安装相关依赖进行解决

这是Deepstream的依赖。

>sudo apt install libssl1.0.0 libgstreamer1.0-0 gstreamer1.0-tools gstreamer1.0-plugins-good gstreamer1.0-plugins-bad gstreamer1.0-plugins-ugly gstreamer1.0-libav libgstrtspserver-1.0-0 libjansson4 gcc make git

这是Deepstream-python-apps的依赖。

>sudo apt install -y git python-dev python3 python3-pip python3.6-dev python3.8-dev cmake g++ build-essential libglib2.0-dev libglib2.0-dev-bin python-gi-dev libtool m4 autoconf automake libgirepository1.0-dev libcairo2-dev

这是gstreamer的依赖。

>sudo apt-get install libgstreamer-plugins-base1.0-dev libgstreamer1.0-dev libgstrtspserver-1.0-dev libx11-dev

这是其他一些依赖。

>sudo apt-get update
>sudo apt-get install libnvinfer8=8.0.1-1+cuda11.3 libnvinfer-plugin8=8.0.1-1+cuda11.3 libnvparsers8=8.0.1-1+cuda11.3 libnvonnxparsers8=8.0.1-1+cuda11.3 libnvinfer-bin=8.0.1-1+cuda11.3 libnvinfer-dev=8.0.1-1+cuda11.3 libnvinfer-plugin-dev=8.0.1-1+cuda11.3 libnvparsers-dev=8.0.1-1+cuda11.3 libnvonnxparsers-dev=8.0.1-1+cuda11.3 libnvinfer-samples=8.0.1-1+cuda11.3 libnvinfer-doc=8.0.1-1+cuda11.3

(2)下载Deepstream

Deepstream下载地址:https://developer.nvidia.com/deepstream-sdk-download-tesla-archived

下载对应版本,这里是我们是Deepstream6.0,选择”servers and workstations“,下载tgz包,并上传电脑。

在这里插入图片描述
将下载好的Deepstream进行解压:

sudo tar -xvf deepstream_sdk_v6.0.1_x86_64.tbz2

转移位置(方便使用):

cd opt
cp nvidia \opt

进行安装:

cd /opt/nvidia/deepstream/deepstream-6.0/
sudo ./install.sh
sudo ldconfig

测试是否成功:

deepstream-app -h

返回相应的帮助文档即可。

(3)python deepstream安装

python-deepstream的github地址:https://github.com/NVIDIA-AI-IOT/deepstream_python_apps

将项目文件下载到DS目录里面:

cd /opt/nvidia/deepstream/deepstream/sources
git clone https://github.com/NVIDIA-AI-IOT/deepstream_python_apps

进行初始化:

cd /opt/nvidia/deepstream/deepstream/sources/deepstream_python_apps/
git submodule update --init

它会把接下来要用的东西自动下载。

(3)GST-python安装

在上一步初始化后,可以进入目录进行安装:

sudo apt-get install -y apt-transport-https ca-certificates -y
sudo update-ca-certificates
cd 3rdparty/gst-python/
./autogen.sh
make
sudo make install

(4)python绑定

还是在初始化后的目录里,可以进行绑定:

cd deepstream_python_apps/bindings
mkdir build
cd build

到这里,我们需要对版本进行说明,以便编译时的安装。版本说明:

在这里插入图片描述
进行cmake,填写相应参数,比如我的电脑时DS6.0,python3.6,x86平台,命令就是:

>cmake ..  -DPYTHON_MAJOR_VERSION=3 -DPYTHON_MINOR_VERSION=6 -DPIP_PLATFORM=linux_x68-64 -DDS_PATH=/opt/nvidia/deepstream/deepstream -DDS_VERSION=6.0
>make

完成后,会在build目录下生成pyds的python包,然后进行安装,并转移pyds.so文件。

pip3 install pyds-1.1.1-py3-none-linux_x86_64.whl
cp pyds.so /opt/nvidia/deepstream/deepstream/lib

(5)测试DS

cd /opt/nvidia/deepstream/deepstream-6.0/sources/deepstream_python_apps/apps/deepstream-test1
python3 deepstream_test_1.py <input .h264 file>

能成功运行就安装完成了。

二、问题汇总

2.1 在测试DS是否成功运行时,出现缺少某些so文件。

第一种情况是,曾经装过其他版本的CUDA或者CUDNN,导致电脑存在两个版本,软连接指向不唯一。

解决办法:

将低版本删除,将高版本指向低版本。比如我报的是libcudnn.so.8这个找不到

cd /usr/local/cuda/lib64
ll libcudnn.so.8*  #会出现相关的文件
rm libcudnn.so.8   #删除低版本
ln -s libcudnn.so.8.2.4 libcudnn.so.8  #软连接指向

第二种情况是,没有装某些依赖,详情看DS安装时的”安装依赖“。

2. 2 在编译时,出现缺少某些h文件。

当进行DS的cmake或者是make时,会报关于h文件的错误。

原因:缺少某些组件没有安装。

解决办法:

比如报gst.h文件的错,可以这样解决:

sudo apt-get install libgstreamer1.0-dev 

或者是video.h文件:

>sudo apt-get install gstreamer1.0-plugins-base gstreamer1.0-plugins-bad gstreamer1.0-libav gstreamer1.0-plugins-bad-videoparsers gstreamer1.0-plugins-good gstreamer1.0-plugins-ugly libgstreamer1.0-0 libgstreamer1.0-dev python3-gst-1.0
>sudo apt-get install libgstreamer-plugins-base1.0-dev
>export GST_PLUGIN_PATH=/usr/lib/x86_64-linux-gnu/gstreamer-1.0

总结:就是某些东西缺了,具体缺啥具体分析。

2. 3 运行py文件时,报出缺少组件。

例如在运行范例时,会报gst导不进去的问题。

解决办法:

把依赖卸了,再装一遍。

2.4 运行py文件时,报找不到gi模块

原因:安装的gi模块的版本不对

解决办法:

第一种是将gi的版本信息修改为自己的版本

cd /usr/lib/python3/dist-packages/gi
#将36改成38
sudo mv _gi_cairo.cpython-36m-x86_64-linux-gnu.so _gi_cairo.cpython-38-x86_64-linux-gnu.so
sudo mv _gi.cpython-36m-x86_64-linux-gnu.so _gi.cpython-38-x86_64-linux-gnu.so

第二种是安装对应gi的python版本。

这也是为什么最开始的时候会强调python版本在3.6和3.8会比较合适。

这篇关于Linux安装CUDA+CUDNN+TRT+DS教程的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/757418

相关文章

Spring Security 从入门到进阶系列教程

Spring Security 入门系列 《保护 Web 应用的安全》 《Spring-Security-入门(一):登录与退出》 《Spring-Security-入门(二):基于数据库验证》 《Spring-Security-入门(三):密码加密》 《Spring-Security-入门(四):自定义-Filter》 《Spring-Security-入门(五):在 Sprin

Zookeeper安装和配置说明

一、Zookeeper的搭建方式 Zookeeper安装方式有三种,单机模式和集群模式以及伪集群模式。 ■ 单机模式:Zookeeper只运行在一台服务器上,适合测试环境; ■ 伪集群模式:就是在一台物理机上运行多个Zookeeper 实例; ■ 集群模式:Zookeeper运行于一个集群上,适合生产环境,这个计算机集群被称为一个“集合体”(ensemble) Zookeeper通过复制来实现

CentOS7安装配置mysql5.7 tar免安装版

一、CentOS7.4系统自带mariadb # 查看系统自带的Mariadb[root@localhost~]# rpm -qa|grep mariadbmariadb-libs-5.5.44-2.el7.centos.x86_64# 卸载系统自带的Mariadb[root@localhost ~]# rpm -e --nodeps mariadb-libs-5.5.44-2.el7

Centos7安装Mongodb4

1、下载源码包 curl -O https://fastdl.mongodb.org/linux/mongodb-linux-x86_64-rhel70-4.2.1.tgz 2、解压 放到 /usr/local/ 目录下 tar -zxvf mongodb-linux-x86_64-rhel70-4.2.1.tgzmv mongodb-linux-x86_64-rhel70-4.2.1/

Makefile简明使用教程

文章目录 规则makefile文件的基本语法:加在命令前的特殊符号:.PHONY伪目标: Makefilev1 直观写法v2 加上中间过程v3 伪目标v4 变量 make 选项-f-n-C Make 是一种流行的构建工具,常用于将源代码转换成可执行文件或者其他形式的输出文件(如库文件、文档等)。Make 可以自动化地执行编译、链接等一系列操作。 规则 makefile文件

linux-基础知识3

打包和压缩 zip 安装zip软件包 yum -y install zip unzip 压缩打包命令: zip -q -r -d -u 压缩包文件名 目录和文件名列表 -q:不显示命令执行过程-r:递归处理,打包各级子目录和文件-u:把文件增加/替换到压缩包中-d:从压缩包中删除指定的文件 解压:unzip 压缩包名 打包文件 把压缩包从服务器下载到本地 把压缩包上传到服务器(zip

Centos7安装JDK1.8保姆版

工欲善其事,必先利其器。这句话同样适用于学习Java编程。在开始Java的学习旅程之前,我们必须首先配置好适合的开发环境。 通过事先准备好这些工具和配置,我们可以避免在学习过程中遇到因环境问题导致的代码异常或错误。一个稳定、高效的开发环境能够让我们更加专注于代码的学习和编写,提升学习效率,减少不必要的困扰和挫折感。因此,在学习Java之初,投入一些时间和精力来配置好开发环境是非常值得的。这将为我

Linux 网络编程 --- 应用层

一、自定义协议和序列化反序列化 代码: 序列化反序列化实现网络版本计算器 二、HTTP协议 1、谈两个简单的预备知识 https://www.baidu.com/ --- 域名 --- 域名解析 --- IP地址 http的端口号为80端口,https的端口号为443 url为统一资源定位符。CSDNhttps://mp.csdn.net/mp_blog/creation/editor

【Python编程】Linux创建虚拟环境并配置与notebook相连接

1.创建 使用 venv 创建虚拟环境。例如,在当前目录下创建一个名为 myenv 的虚拟环境: python3 -m venv myenv 2.激活 激活虚拟环境使其成为当前终端会话的活动环境。运行: source myenv/bin/activate 3.与notebook连接 在虚拟环境中,使用 pip 安装 Jupyter 和 ipykernel: pip instal