lars专题

速神经网络的训练算法LARS/LAMB工作原理 --UC Berkeley在读博士生尤洋

为什么深度学习很慢？如果我们利用并行计算，怎样才能完美的利用大量的processor？为什么large batch size会引起精度降低？新优化器参考：快速神经网络的训练算法 --UC Berkeley博士尤洋本片文章介绍的两种算法不仅可以优化并行计算，在普通硬件环境中运行也是有效的。算法是由UC Berkeley博士尤洋开发。在固定精度的情况下，新算法可以更快的达到要求，在固定训