本文主要是介绍gpustat : Linux下面监控GPU状态,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
nvidia-smi是 Nvidia 显卡命令行管理套件,基于 NVML 库,旨在管理和监控 Nvidia GPU 设备。
nvidia-smi 的输出
这是 nvidia-smi 命令的输出,其中最重要的两个指标:
显存占用
GPU 利用率
显存占用和 GPU 利用率是两个不一样的东西,显卡是由 GPU 计算单元和显存等组成的,显存和 GPU 的关系有点类似于内存和 CPU 的关系。
这里推荐一个好用的小工具:gpustat, 直接pip install gpustat
即可安装,gpustat 基于nvidia-smi,可以提供更美观简洁的展示,结合 watch 命令,可以动态实时监控 GPU 的使用情况。
watch --color -n1 gpustat -cpu
gpustat 输出
显存可以看成是空间,类似于内存。
显存用于存放模型,数据
显存越大,所能运行的网络也就越大
GPU 计算单元类似于 CPU 中的核,用来进行数值计算。衡量计算量的单位是 flop: the number of floating-point multiplication-adds,浮点数先乘后加算一个 flop。计算能力越强大,速度越快。衡量计算能力的单位是 flops: 每秒能执行的 flop 数量
1*2+3 1 flop
1*2 + 3*4 + 4*5 3 flop
这篇关于gpustat : Linux下面监控GPU状态的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!