基本工具 NVCC(NVIDIA CUDA Compiler): nvcc 是 NVIDIA 提供的 CUDA 编译器,用于将 CUDA 源代码(.cu 文件)编译成可执行文件或库。它可以处理 CUDA 和主机代码(例如 C++)的混合编译。nvcc 调用底层的主机编译器(如 gcc 或 clang)来编译非 CUDA 代码部分。 CUDA Toolkit: 包含 CUDA 编译器、库、开发
写在前面 最近几个月都在忙着毕业的事,好一阵子没写代码了。今天准备跑个demo,发现报错 AssertionError: Torch not compiled with CUDA enabled 不知道啥情况,因为之前有cuda环境,能用gpu加速,看这个报错信息应该是Pytorch下没有可用的cuda,不知道咋没了。因而决定从头开始配置一下环境,以此博文记录一下~ 安装cuda
关于提高performance的一些建议: Important caveat:number of threads 并不是越多并行线程效率越高,因为每个线程都消耗一定的resource,主要是register和shared memory。所以开出再多的线程,GPU也只能在有限的资源下让一部分并行。优化应该根据资源需求。 unavoidable bottleneck: transfer b
环境: RTX3090cuda11.2tensorflow 2.4.1Ubuntu 18.04 测试TensorFlow使用是否能够使用GPU import tensorflow as tftf.config.list_physical_devices('GPU') 出现libcusolver.so.10 not found 在tensorflow 的issues#43947发现解决方案