随即近似与随机梯度下降

2024-09-03 01:44

文章标签 近似梯度下降随机随即

本文主要是介绍随即近似与随机梯度下降，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

一、均值计算

方法1：是直接将采样数据相加再除以个数，但这样的方法运行效率较低，要将所有数据收集到一起后再求平均。
方法2：迭代法

二、随机近似法: Robbins-Monro算法（RM算法）

在这里插入图片描述

1. g(w)是有界且递增的
1. ak的和等于无穷，并且ak平方和小于无穷。我们会发现在许多强化学习算法中，通常会选择 ak作为一个足够小的常数，因为 1/k 会越来越小导致算法效率较低。尽管在这种情况下第二个条件没有被满足，但算法仍然可以有效地工作，因为实际迭代的次数是有限。
1. 关于系数 η ，表明 η 的期望为0，方差有界

RM算法是个迭代式的算法，对 w* 第 k 次的估计是 wk，第 k+1 次的估计是 wk+1，则有
在这里插入图片描述最开始的时候我输入 w1，得到 g~1，然后带入到下式的右侧，得到 w2，再把 w2 输入，再得到 g~2，再带入下式的右侧，得到 w3，以此类推。最后我们会得到 {wk} 的序列和 {g~k} 的序列。RM 算法就是通过这样一种方式来求解的

随机梯度下降（SDG）

SGD 是 RM 算法的特殊情况，mean estimation 算法也是 SGD 的特殊情况
在这里插入图片描述
求解这个问题有多种方法，下面给出三种方法：

方法1：梯度下降（gradient descent，GD）

因为我们的目标是最小化一个目标函数，所以要用梯度下降；如果目标是最大化一个目标函数，就要用梯度上升。
在这里插入图片描述

缺点：难以获得期望值（expected value）。对此有两种解决方法：第一种方法，如果有模型就可以求出来；第二种方法，如果没有模型，用数据求

方法2：批量梯度下降（batch gradient descent，BGD）
在这里插入图片描述
缺点：每次迭代都需要对每个 wk 进行多次采样。在每次更新 wk 的时候都要采样 n 次或者多次。这在实际中还是不实用，那么来到了方法3

方法3：随机梯度下降（stochastic gradient descent，SGD）
在这里插入图片描述

这篇关于随即近似与随机梯度下降的文章就介绍到这儿，希望我们推荐的文章对编程师们有所帮助！

http://www.chinasem.cn/article/1131667。 23002807@qq.com

相关文章

C/C++的OpenCV 进行图像梯度提取的几种实现

C/C++的OpenCV 进行图像梯度提取的几种实现

《C/C++的OpenCV进行图像梯度提取的几种实现》本文主要介绍了C/C++的OpenCV进行图像梯度提取的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的... 目录预www.chinasem.cn备知识1. 图像加载与预处理2. Sobel 算子计算 X 和 Y

阅读更多...

Python开发文字版随机事件游戏的项目实例

Python开发文字版随机事件游戏的项目实例

《Python开发文字版随机事件游戏的项目实例》随机事件游戏是一种通过生成不可预测的事件来增强游戏体验的类型,在这篇博文中,我们将使用Python开发一款文字版随机事件游戏,通过这个项目,读者不仅能够... 目录项目概述2.1 游戏概念2.2 游戏特色2.3 目标玩家群体技术选择与环境准备3.1 开发环境3

阅读更多...

pytorch自动求梯度autograd的实现

pytorch自动求梯度autograd的实现

《pytorch自动求梯度autograd的实现》autograd是一个自动微分引擎,它可以自动计算张量的梯度,本文主要介绍了pytorch自动求梯度autograd的实现,具有一定的参考价值,感兴趣... autograd是pytorch构建神经网络的核心。在 PyTorch 中，结合以下代码例子，当你

阅读更多...

Python中随机休眠技术原理与应用详解

Python中随机休眠技术原理与应用详解

《Python中随机休眠技术原理与应用详解》在编程中,让程序暂停执行特定时间是常见需求,当需要引入不确定性时,随机休眠就成为关键技巧,下面我们就来看看Python中随机休眠技术的具体实现与应用吧... 目录引言一、实现原理与基础方法1.1 核心函数解析1.2 基础实现模板1.3 整数版实现二、典型应用场景2

阅读更多...

Python中的随机森林算法与实战

Python中的随机森林算法与实战

《Python中的随机森林算法与实战》本文详细介绍了随机森林算法,包括其原理、实现步骤、分类和回归案例,并讨论了其优点和缺点,通过面向对象编程实现了一个简单的随机森林模型,并应用于鸢尾花分类和波士顿房... 目录1、随机森林算法概述2、随机森林的原理3、实现步骤4、分类案例：使用随机森林预测鸢尾花品种4.1

阅读更多...

使用C#如何创建人名或其他物体随机分组

使用C#如何创建人名或其他物体随机分组

《使用C#如何创建人名或其他物体随机分组》文章描述了一个随机分配人员到多个团队的代码示例,包括将人员列表随机化并根据组数分配到不同组,最后按组号排序显示结果... 目录C#创建人名或其他物体随机分组此示例使用以下代码将人员分配到组代码首先将lstPeople ListBox总结C#创建人名或其他物体随机分组

阅读更多...

csu1328（近似回文串）

csu1328（近似回文串）

题意：求近似回文串的最大长度，串长度为1000。解题思路：以某点为中心，向左右两边扩展，注意奇偶分开讨论，暴力解即可。时间复杂度O(n^2); 代码如下： #include<iostream>#include<algorithm>#include<stdio.h>#include<math.h>#include<cstring>#include<string>#inclu

阅读更多...

✨机器学习笔记（二）—— 线性回归、代价函数、梯度下降

✨机器学习笔记（二）—— 线性回归、代价函数、梯度下降

1️⃣线性回归（linear regression） f w , b ( x ) = w x + b f_{w,b}(x) = wx + b fw,b(x)=wx+b 🎈A linear regression model predicting house prices：如图是机器学习通过监督学习运用线性回归模型来预测房价的例子，当房屋大小为1250 f e e t 2 feet^

阅读更多...

AI学习指南深度学习篇-带动量的随机梯度下降法的基本原理

AI学习指南深度学习篇-带动量的随机梯度下降法的基本原理

AI学习指南深度学习篇——带动量的随机梯度下降法的基本原理引言在深度学习中，优化算法被广泛应用于训练神经网络模型。随机梯度下降法（SGD）是最常用的优化算法之一，但单独使用SGD在收敛速度和稳定性方面存在一些问题。为了应对这些挑战，动量法应运而生。本文将详细介绍动量法的原理，包括动量的概念、指数加权移动平均、参数更新等内容，最后通过实际示例展示动量如何帮助SGD在参数更新过程中平稳地前进。

阅读更多...

随机密码生成器应具备哪些默认功能？

随机密码生成器应具备哪些默认功能？

阅读更多...