安装cuda、cudnn、Pytorch(用cuda和cudnn加速计算)

2024-06-20 07:12

本文主要是介绍安装cuda、cudnn、Pytorch(用cuda和cudnn加速计算),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

写在前面

最近几个月都在忙着毕业的事,好一阵子没写代码了。今天准备跑个demo,发现报错 AssertionError: Torch not compiled with CUDA enabled

不知道啥情况,因为之前有cuda环境,能用gpu加速,看这个报错信息应该是Pytorch下没有可用的cuda,不知道咋没了。因而决定从头开始配置一下环境,以此博文记录一下~


安装cuda

1、了解cuda版本

打开英伟达控制面板 -> 左下角“系统信息” -> 组件

可以看到:我的电脑所能兼容的最高cuda版本为12.5

2、安装cuda

进入官网:CUDA Toolkit Archive | NVIDIA Developer,选择合适的版本进行安装

因为我的电脑所能兼容的最高cuda版本为12.5,所以我选择了12.4进行下载安装,同时我的电脑系统为win11,如下:

安装时,选择“自定义(高级)” -> 取消勾选CUDA下的Visual Studio Integration

我选择的安装位置为F:\NVIDIA GPU Computing Toolkit\CUDA\v12.4。安装完成后检查一下是否有环境变量,没有的话手动添加一下

3、测试是否安装成功

在cmd里输入nvcc -V,出现类似下图的界面就ok了~


安装cudnn

1、安装cuda后还要安装cudnn?

  • CUDA:是一个通用的并行计算平台和编程模型,用于利用 NVIDIA GPU 进行通用计算。CUDA 提供了一种编写 GPU 加速代码的方式,使开发者可以利用 GPU 的强大计算能力进行高性能计算
  • cuDNN:是构建在 CUDA 之上的专用库,专注于深度学习领域的优化。它使用 CUDA 来执行底层的并行计算,但提供了更高层的、针对深度学习任务优化的操作

安装 CUDA 可以利用 GPU 的并行计算能力来加速通用计算任务,包括但不限于深度学习。然而,深度学习中的许多计算操作(如卷积、反向传播等)需要特殊优化,直接使用 CUDA 编写这些操作的效率可能不如使用专门的库,如 cuDNN 或其他深度学习框架。如果目标是使用 GPU 来加速深度学习任务,除了安装 CUDA,还需要安装 cuDNN。这是因为 cuDNN 提供了高度优化的深度学习操作,可以显著提高训练和推理的速度。

2、cudnn下载

网站CUDA Deep Neural Network (cuDNN) | NVIDIA Developer,点击Download cuDNN Library

将下载下来的cudnn文件解压,并用解压出的文件直接替换cuda安装目录下的文件


安装pytorch-gpu

1、配置新的虚拟环境 

打开Anaconda Prompt,利用conda配置一个新的虚拟环境并激活

可以看到我的Python版本是3.8

故输入以下两个命令:

conda create -n torch_gpu python=3.8
conda activate torch_gpu

看到前面的base变为torch_gpu即可 

2、安装Pytorch

官网PyTorch,选择自己的配置后得到一串命令,输入上面的命令行中

3、小插曲&安装方式二

安装的时候报错了,报错信息 CondaError: Downloaded bytes did not match Content-Length

查了一下原因说是使用conda安装包下载的时候速度较慢,导致下载timeout而终止,从而未完成整个安装包的下载。

于是尝试第二种安装方法:国内镜像网站安装,网址https://download.pytorch.org/whl/torch_stable.html

  • 选择合适的版本,注意一定要选择cu开头的才是gpu版本
  • torch后面的数字是torch版本(我下的是2.3.1),cp后是对应的python版本(我是3.8),还要注意操作系统(我是win)

下载torchvision的时候要特别注意torch与torchvision的版本对应关系,参考GitHub - pytorch/vision: Datasets, Transforms and Models specific to Computer Vision

所以我要下载0.18版本的torchvision,其他跟上面保持一致,如下:

下载完成后得到以下两个whl文件:

在Pycharm终端,进入到该路径下运行:

cd C:\Users\11842\Downloads
conda activate torch_gpu
pip install "torch-2.3.1+cu118-cp38-cp38-win_amd64.whl" --trusted-host pypi.tuna.tsinghua.edu.cn
pip install "torchvision-0.18.1+cpu-cp38-cp38-win_amd64.whl" --trusted-host pypi.tuna.tsinghua.edu.cn

如下图:

等待两个均成功安装即可 

4、检测是否安装成功

输入python进入终端:

import torch
print(torch.cuda.is_available())

返回True,即pytorch-gpu安装成功

5、增加到Pycharm的编译器里

想重新用cuda加速跑demo时,发现Pycharm的编译器里还没有刚刚新创建的虚拟环境。如下图所示,File -> Settings -> Python Interpreter:

手动添加:点击上图的+,选择第三个System Interpreter,添加上下图的地址D:\Anaconda\envs\torch_gpu\python.exe,并重命名一下

这样就大功告成啦~ 

可以看到demo可以成功跑起来啦~


参考

1050ti显卡安装cuda_1050ti cuda-CSDN博客

Pycharm搭建CUDA,Pytorch教程(匹配版本,安装,搭建全保姆教程)_cuda12.3对应的pytorch版本-CSDN博客

这篇关于安装cuda、cudnn、Pytorch(用cuda和cudnn加速计算)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1077455

相关文章

ESP32 esp-idf esp-adf环境安装及.a库创建与编译

简介 ESP32 功能丰富的 Wi-Fi & 蓝牙 MCU, 适用于多样的物联网应用。使用freertos操作系统。 ESP-IDF 官方物联网开发框架。 ESP-ADF 官方音频开发框架。 文档参照 https://espressif-docs.readthedocs-hosted.com/projects/esp-adf/zh-cn/latest/get-started/index

Linux 安装、配置Tomcat 的HTTPS

Linux 安装 、配置Tomcat的HTTPS 安装Tomcat 这里选择的是 tomcat 10.X ,需要Java 11及更高版本 Binary Distributions ->Core->选择 tar.gz包 下载、上传到内网服务器 /opt 目录tar -xzf 解压将解压的根目录改名为 tomat-10 并移动到 /opt 下, 形成个人习惯的路径 /opt/tomcat-10

计算绕原点旋转某角度后的点的坐标

问题: A点(x, y)按顺时针旋转 theta 角度后点的坐标为A1点(x1,y1)  ,求x1 y1坐标用(x,y)和 theta 来表示 方法一: 设 OA 向量和x轴的角度为 alpha , 那么顺时针转过 theta后 ,OA1 向量和x轴的角度为 (alpha - theta) 。 使用圆的参数方程来表示点坐标。A的坐标可以表示为: \[\left\{ {\begin{ar

VMware9.0详细安装

双击VMware-workstation-full-9.0.0-812388.exe文件: 直接点Next; 这里,我选择了Typical(标准安装)。 因为服务器上只要C盘,所以我选择安装在C盘下的vmware文件夹下面,然后点击Next; 这里我把√取消了,每次启动不检查更新。然后Next; 点击Next; 创建快捷方式等,点击Next; 继续Cont

vcpkg安装opencv中的特殊问题记录(无法找到opencv_corexd.dll)

我是按照网上的vcpkg安装opencv方法进行的(比如这篇:从0开始在visual studio上安装opencv(超详细,针对小白)),但是中间出现了一些别人没有遇到的问题,虽然原因没有找到,但是本人给出一些暂时的解决办法: 问题1: 我在安装库命令行使用的是 .\vcpkg.exe install opencv 我的电脑是x64,vcpkg在这条命令后默认下载的也是opencv2:x6

【服务器运维】CentOS6 minimal 离线安装MySQL5.7

1.准备安装包(版本因人而异,所以下面的命令中版本省略,实际操作中用Tab自动补全就好了) cloog-ppl-0.15.7-1.2.el6.x86_64.rpmcpp-4.4.7-23.el6.x86_64.rpmgcc-4.4.7-23.el6.x86_64.rpmgcc-c++-4.4.7-23.el6.x86_64.rpmglibc-2.12-1.212.el6.x86_64.r

【服务器运维】CentOS7 minimal 离线安装 gcc perl vmware-tools

0. 本机在有网的情况下,下载CentOS镜像 https://www.centos.org/download/ 1. 取出rpm 有的情况可能不需要net-tools,但是如果出现跟ifconfig相关的错误,就把它安装上。另外如果不想升级内核版本的话,就找对应内核版本的rpm版本安装 perl-Time-Local-1.2300-2.el7.noarch.rpmperl-Tim

Windows/macOS/Linux 安装 Redis 和 Redis Desktop Manager 可视化工具

本文所有安装都在macOS High Sierra 10.13.4进行,Windows安装相对容易些,Linux安装与macOS类似,文中会做区分讲解 1. Redis安装 1.下载Redis https://redis.io/download 把下载的源码更名为redis-4.0.9-source,我喜欢跟maven、Tomcat放在一起,就放到/Users/zhan/Documents

Ubuntu20.04离线安装Docker

1.下载3个docker离线安装包,下载网址: https://download.docker.com/linux/ubuntu/dists/xenial/pool/stable/amd64/ 2.把3个离线安装包拷贝到ubuntu本地执行以下命令 sudo dpkg -i containerd.io_1.4.6-1_amd64.deb sudo dpkg -i docker-ce-c

Windows中,.net framework 3.5安装

安装.net framework,目前已知2种方法,如下: 一、在MSDN下载对应的安装包,安装,这种可能无法安装成功,概率很大,不成功使用第二种方法,基本上没问题。 二、win8/8.1/10 下安装 .net framework 3.5.1: 1. 打开 win8/8.1/10 安装盘(这里指系统安装镜像文件),提取 sources\sxs 文件夹到 X:\sources\sxs (X代