找不到GPU资源——[显存充足，但是却出现CUDA error:out of memory错误]

2024-03-05 18:58

文章标签 error 错误 gpu memory 资源不到 cuda 显存充足

本文主要是介绍找不到GPU资源——[显存充足，但是却出现CUDA error:out of memory错误]，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

说明:

系统：Centos（Redhat）
环境：python3.6+pytorch1.4.0（gpu）+tensorflow2.0.0（cpu）
Cuda：9.2
Cudnn：7.0.6？
模型 YOLOv3

描述

图找不到了，就去隔壁偷了一张（传送）
在运行git上的yolov3目标检测项目的时候尝试使用GPU加速，结果爆出CUDA error:out of memory
隔壁说是找不到GPU资源：解决方法如下(抄的)：

'''
1.使用python的os模块import osos.environ['CUDA_VISIBLE_DEVICES']='2, 3'
# 表示2,3可见，用哪块需设置，默认是用第一个2.直接设置环境变量(linux系统)export CUDA_VISIBLE_DEVICES=2,3
'''

简单来说就是找到GPU就完事了，我照做，问题解决了。

问题探究

我特地查看了一下服务器的显卡配置
8张，除去第0张不能用（不知道为什么，测试出来的），剩余7张都是可以用的
说明一下 Bus-Id Disp.A这一栏下面是显存使用情况，每一张16GIB左右大小，目前被我占用的有2,3两块，也就是他们
换句话说，之所以会出现CUDA error:out of memory这个错误，因为当没有指定用哪块GPU的时候，就默认第一块，那么大家都用第一块，当第一块不够了，自然就会抛出显存溢出这个错误。

另外分享一个实时查看显卡信息的命令；

watch -n 10 nvidia-smi

10=10秒，每隔10秒
nvidia-smi表示查看显卡
其实这是两个命令的结合，watch命令后面也可以不是nvidia-smi

这篇关于找不到GPU资源——[显存充足，但是却出现CUDA error:out of memory错误]的文章就介绍到这儿，希望我们推荐的文章对编程师们有所帮助！

http://www.chinasem.cn/article/777494。 23002807@qq.com

相关文章

SpringBoot+Docker+Graylog 如何让错误自动报警

SpringBoot+Docker+Graylog 如何让错误自动报警

《SpringBoot+Docker+Graylog如何让错误自动报警》SpringBoot默认使用SLF4J与Logback,支持多日志级别和配置方式,可输出到控制台、文件及远程服务器,集成ELK... 目录01 Spring Boot 默认日志框架解析02 Spring Boot 日志级别详解03 Sp

阅读更多...

Python中Tensorflow无法调用GPU问题的解决方法

Python中Tensorflow无法调用GPU问题的解决方法

《Python中Tensorflow无法调用GPU问题的解决方法》文章详解如何解决TensorFlow在Windows无法识别GPU的问题,需降级至2.10版本,安装匹配CUDA11.2和cuDNN... 当用以下代码查看GPU数量时，gpuspython返回的是一个空列表，说明tensorflow没有找到

阅读更多...

C++中RAII资源获取即初始化

C++中RAII资源获取即初始化

《C++中RAII资源获取即初始化》RAII通过构造/析构自动管理资源生命周期,确保安全释放,本文就来介绍一下C++中的RAII技术及其应用,具有一定的参考价值,感兴趣的可以了解一下... 目录一、核心原理与机制二、标准库中的RAII实现三、自定义RAII类设计原则四、常见应用场景1. 内存管理2. 文件操

阅读更多...

SpringBoot排查和解决JSON解析错误(400 Bad Request)的方法

SpringBoot排查和解决JSON解析错误(400 Bad Request)的方法

《SpringBoot排查和解决JSON解析错误(400BadRequest)的方法》在开发SpringBootRESTfulAPI时,客户端与服务端的数据交互通常使用JSON格式,然而,JSON... 目录问题背景1. 问题描述2. 错误分析解决方案1. 手动重新输入jsON2. 使用工具清理JSON3.

阅读更多...

springboot加载不到nacos配置中心的配置问题处理

springboot加载不到nacos配置中心的配置问题处理

《springboot加载不到nacos配置中心的配置问题处理》：本文主要介绍springboot加载不到nacos配置中心的配置问题处理,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑... 目录springboot加载不到nacos配置中心的配置两种可能Spring Boot 版本Nacos

阅读更多...

如何解决Druid线程池Cause:java.sql.SQLRecoverableException:IO错误:Socket read timed out的问题

如何解决Druid线程池Cause:java.sql.SQLRecoverableException:IO错误:Socket read timed out的问题

《如何解决Druid线程池Cause:java.sql.SQLRecoverableException:IO错误:Socketreadtimedout的问题》：本文主要介绍解决Druid线程... 目录异常信息触发场景找到版本发布更新的说明从版本更新信息可以看到该默认逻辑已经去除总结异常信息触发场景复

阅读更多...

Python struct.unpack() 用法及常见错误详解

Python struct.unpack() 用法及常见错误详解

《Pythonstruct.unpack()用法及常见错误详解》struct.unpack()是Python中用于将二进制数据（字节序列）解析为Python数据类型的函数,通常与struct.pa... 目录一、函数语法二、格式字符串详解三、使用示例示例 1：解析整数和浮点数示例 2：解析字符串示例 3：解

阅读更多...

CentOS 7 YUM源配置错误的解决方法

CentOS 7 YUM源配置错误的解决方法

《CentOS7YUM源配置错误的解决方法》在使用虚拟机安装CentOS7系统时,我们可能会遇到YUM源配置错误的问题,导致无法正常下载软件包,为了解决这个问题,我们可以替换YUM源... 目录一、备份原有的 YUM 源配置文件二、选择并配置新的 YUM 源三、清理旧的缓存并重建新的缓存四、验证 YUM 源

阅读更多...

conda安装GPU版pytorch默认却是cpu版本

conda安装GPU版pytorch默认却是cpu版本

《conda安装GPU版pytorch默认却是cpu版本》本文主要介绍了遇到Conda安装PyTorchGPU版本却默认安装CPU的问题,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的... 目录一、问题描述二、网上解决方案罗列【此节为反面方案罗列！！！】三、发现的根本原因[独家]3.1 p

阅读更多...

python3 pip终端出现错误解决的方法详解

python3 pip终端出现错误解决的方法详解

《python3pip终端出现错误解决的方法详解》这篇文章主要为大家详细介绍了python3pip如果在终端出现错误该如何解决,文中的示例方法讲解详细,感兴趣的小伙伴可以跟随小编一起了解一下... 目录前言一、查看是否已安装pip二、查看是否添加至环境变量1.查看环境变量是http://www.cppcns

阅读更多...