RuntimeError: Trying to backward through the graph a second time but the buffers have already been f

本文主要是介绍RuntimeError: Trying to backward through the graph a second time but the buffers have already been f，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

RuntimeError: Trying to backward through the graph a second time, but the buffers have already been freed

遇到过几次这个报错了，这几天把backward和autograd给看了几遍，终于摸着点门道

首先要知道，为什么会报这个错，这个错翻译成白话文就是说：当我们第二次backward的时候，计算图的结构已经被破坏了（buffer的梯度被释放了），这也是pytorch动态图的机制，可以节省内存。

这里不仔细讲解backward是怎么工作的了，一般我们在训练的时候常用的就是loss.backward（）这种写法，loss一般是一个标量

在pytorch的计算图中，其实只有两种元素：tensor和function，function就是加减乘除、开方、幂指对、三角函数等可求导运算，而tensor可细分为两类：叶子节点(leaf node)和非叶子节点。使用backward()函数反向传播计算tensor的梯度时，并不计算所有tensor的梯度，而是只计算满足这几个条件的tensor的梯度：1.类型为叶子节点、2.requires_grad=True、3.依赖该tensor的所有tensor的requires_grad=True。

看下面的这段代码

这样执行完以后就会报开头的错

根据这段代码画出计算图，x是叶子节点，y和z都不是叶子节点

当我们进行m.backward（）之后，这个红框内的计算图就被破坏了，报错里说 the buffers have already been freed，在这张图上，很明显y不是叶子节点，不属于m.backward()里要计算的tensor，buffer指的就是y的梯度被释放掉了, m.backward()只会计算保留x的梯度

如果不想释放y的梯度怎么办，可以用m.backward(retain_graph=True)

buffer：反向传播中不需要被optimizer更新，区别于parameter