多卡会专题

mindspore-NPU单卡可以执行,多卡会报错

图模式,数据并行 单卡可以正常执行训练和推断,多卡训练会报错,hccl 的 json 文件和多卡的脚本都按照官方文档构建的。  建立 hccl 的 json 文件的问题,我在 8p 的机器上只希望使用 4 张卡,在构建 json 文件时就要指出,不能构建 8 卡的 json 文件,但是使用四张卡。