nesterov专题

$深度模型中的优化(四)、动量(momentum)和Nesterov动量$

深度模型中的优化(四)、动量(momentum)和Nesterov动量

参考动量(momentum)和Nesterov动量 - 云+社区 - 腾讯云一、动量虽然随机梯度下降仍然是非常受欢迎的优化方法，但其学习过程有时会很慢。动量方法旨在加速学习，特别是处理高曲率、小但一致的梯度，或是带噪声的梯度。动量算法积累了之前梯度指数级衰减的移动平均，并且继续沿该方向移动。从形式上看，动量算法引入了变量v充当速度角色------它代表参数在参数空间移动的方向和速率。

Deep Learning 最优化方法之Nesterov(牛顿动量)

本文是Deep Learning 之最优化方法系列文章的Nesterov(牛顿动量)方法。主要参考Deep Learning 一书。整个优化系列文章列表： Deep Learning 之最优化方法 Deep Learning 最优化方法之SGD Deep Learning 最优化方法之Momentum（动量） Deep Learning 最优化方法之Nesterov(牛顿动量) Deep