Mxnet (28): 动量(Momentum)

2024-04-17 19:58
文章标签 28 动量 mxnet momentum

本文主要是介绍Mxnet (28): 动量(Momentum),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

执行随机梯度下降时,面对噪声时选择学习速率需要格外注意。如果学习速率下降的太快,就会过早停止,如果下降的太慢,就会导致无法得到足够的收敛,以至于噪音使我们不但远离最有解。

1. 收敛与发散问题

通过一个例子说明问题:

f ( x ) = 0.1 x 1 2 + 2 x 2 2 . f(\mathbf{x}) = 0.1 x_1^2 + 2 x_2^2. f(x)=0.1x12+2x22.

from d2l import mxnet as d2l
from mxnet import np, npx, autograd, init, gluon
from mxnet.gluon import nn
import plotly.graph_objs as go
import plotly.express as px
import pandas as pd
npx.set_np()ddef train_2d(trainer, steps=20):  """优化二维目标"""# s1和s2是内部状态变量x1, x2, s1, s2 = -5, -2, 0, 0results = [[x1], [x2]]for i in range(steps):x1, x2, s1, s2 = trainer(x1, x2, s1, s2)results[0].append(x1)results[1].append(x2)return resultsdef show_trace_2d(f, results): """2D可视化"""fig = go.Figure()y_max =max(results[1]) +1  if 2 < max(results[1]) < 6 else 3x1, x2 = np.meshgrid(np.arange(-5.5, 1.0, 0.1),  np.arange(-3.5, y_max, 0.1))fig.add_trace(go.Contour(x=x1[0].tolist(), y=x2.T[0].tolist(), z=f(x1, x2).tolist(),showscale=False , colorscale='YlGnBu'))fig.add_trace(go.Scatter(x=results[0], y=results[1] , mode='lines+markers', marker={'size':8}))fig.update_layout(width=500, height = 380, xaxis_title='x1', yaxis_title='x2')fig.show()

f f f ( 0 , 0 ) (0, 0) (0,0)有最小值。这个函数在 x 1 x_1 x

这篇关于Mxnet (28): 动量(Momentum)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/912708

相关文章

【vue3|第28期】 Vue3 + Vue Router:探索路由重定向的使用与作用

日期:2024年9月8日 作者:Commas 签名:(ง •_•)ง 积跬步以致千里,积小流以成江海…… 注释:如果您觉在这里插入代码片得有所帮助,帮忙点个赞,也可以关注我,我们一起成长;如果有不对的地方,还望各位大佬不吝赐教,谢谢^ - ^ 1.01365 = 37.7834;0.99365 = 0.0255 1.02365 = 1377.4083;0.98365 = 0.0006 说

打靶记录16——Momentum

靶机: https://download.vulnhub.com/momentum/Momentum.ova 下载后使用 VirtualBox 打开 难度:中 目标:取得 root 权限 + 2 Flag 攻击方法: 主机发现端口扫描信息收集Web 路径爆破XSS 漏洞JS 脚本分析AES 解密Redis 认证漏洞 主机发现 sudo arp-scan -l 端口扫描和服务发

【抽代复习笔记】28-群(二十二):四道子群例题

例1:证明,循环群的子群是循环群。 证:设G = (a),H ≤ G。 (1)若H = {e},则H是一阶循环群; (2)设H至少包含2个元素,即设H = {...,a^(-k),a^(-j),a^(-i),a^0,a^i,a^j,a^k,...}, 其中a^i是H中正指数最小的元素,0<i<j<k, 下证a^i是H的生成元: 对任意的a^t∈H(t∈Z),存在q∈Z,使得t = qi

【C++学习(28)】通俗一点讲解:std::bind 回调技术

std::bind 是 C++11 标准库中的一个功能,它允许你“绑定”某些参数到一个函数、成员函数或可调用对象上,从而生成一个新的可调用对象。这种新的可调用对象可以稍后被调用,而且其中一些参数已经被预先设置好了。这在回调函数和异步编程中特别有用。 下面我用一个通俗的例子来解释 std::bind 是如何工作的。 假设场景 假设你有一个家庭厨师,他有一个技能叫做“做饭”。做饭需要两个参数:一

『功能项目』Unity连接读取本地数据库【28】

打开上一篇27账号登陆注册界面UI搭建的项目, 本章要做的事情是本地数据库的连接与读取数据库中的道具信息(刀、铁块) 访问官方网站:MySQL 一、下载Mysql 首页滑到最下面,选择Downloads下的MySQL Community server 点击查看下载历史版本 下载完毕后将文件解压到你想保存到的盘和目录内。我是将文件解压到E:Program FilesM

代码随想录 刷题记录-28 图论 (5)最短路径

一、dijkstra(朴素版)精讲 47. 参加科学大会 思路 本题就是求最短路,最短路是图论中的经典问题即:给出一个有向图,一个起点,一个终点,问起点到终点的最短路径。 接下来讲解最短路算法中的 dijkstra 算法。 dijkstra算法:在有权图(权值非负数)中求从起点到其他节点的最短路径算法。 需要注意两点: dijkstra 算法可以同时求 起点到所有节点的最短路径权值不

代码随想录第八天|151.翻转字符串里的单词 卡码网:55.右旋转字符串 28. 实现 strStr() 459.重复的子字符串

反转字符串的单词 思路:刷过稍微忘记 class Solution {public://去除空格string remove(string s){//使用快慢指针int slow=0;int i=0;for(;i<s.size();i++){if(s[i]!=' '){if(slow!=0){s[slow++]=' ';}while(s[i]!=' '&&i<s.size()){s[slow+

2024.08.28 校招 实习 内推 面经

🛰️  :neituijunsir    交* 流*裙 ,内推/实习/校招汇总表格  1、校招 | 吉利控股集团2025届全球校园招聘启动(内推) 校招 | 吉利控股集团2025届全球校园招聘启动(内推) 2、校招 | 滴滴2025秋季校招正式启动(内推) 校招 | 滴滴2025秋季校招正式启动(内推) 3、校招 | 2025年上汽集团校园招募行动全面启动啦! 校招 |

leetcode解题思路分析(四)22-28题

括号生成 给出 n 代表生成括号的对数,请你写出一个函数,使其能够生成所有可能的并且有效的括号组合。 很容易想到采用回溯法解决该题,通过画出树分析递归规律可得如下代码 class Solution {public:void backtrace(int left, int right, int n, string& s, vector<string>& res) {if (left == n

idea 编译断点运行 tomcat 10.1.28 源码

idea 编译运行 tomcat 10.1.28 源码 1. 所需资源 tomcat 10.1.28 zulu JDK 22 maven idea (支持 JDK 22) 2. Idea 导入项目 10.1.28.tar.gz 解压到指定文件夹 如 ~\tomcat-source\tomcat-10.1.28 这里等待一段时间,生成 ~\tomcat-source\tomcat-10.1.