sbatch专题

并行 云架构 深度框架 sbatch slurm 深度学习 tensorflow环境从搭建到使用 conda

有一定的GPU云时常可用,一个节点4个GPU,我本人决定使用anaconda搭建tensorflow1.13并且使用。 anaconda是乙方提供的,使用bash命令可以加载 module load anaconda/3.7 加载后正常使用create命令建立环境 详情见我所有conda标志的博客,其实就是下面一句代码,看明白就不用翻了。  下面这句代码就从零开始建立了一个tensorf

sbatch: error: Batch job submission failed: Invalid user id

slurm提交作业任务时,报错:  解决方法: 这是因为提交作业时用户名不对。切换到普通用户提交即可 如: su test