随机规划:求解报童问题期望值模型的算法方案

2024-04-01 09:36

本文主要是介绍随机规划:求解报童问题期望值模型的算法方案,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

文章目录

  • 1 引言
  • 2 数学模型
  • 3 报童问题
    • 3.1 直接最优化
    • 3.2 样本均值近似
    • 3.3 两阶段规划
    • 3.4 结果分析
  • 4 在线求教
  • 5 相关阅读

1 引言

上一篇关于不确定优化的文章(不确定优化入门:用简单实例讲明白随机规划、鲁棒优化和分布鲁棒优化 )发表后,被部分大佬认为是一篇科普文,有点诚惶诚恐,毕竟我从今年才开始认真学习不确定优化,水平还很有限。

秉承着先了解大概框架再深入学习各类算法细节的心态,我在那篇文章中,用简化版的报童问题,把求解不确定优化的各类算法方案做了直观上的实践和比较,完成了算法框架的初步梳理。

现在,已经到学习算法方案详细设计的阶段了。

我的学习路径一如既往的是从简单到复杂,所以,本文要研究的问题是随机规划中最简单的一类:决策变量只有1个,不确定参数也只有1个且分布函数已知;解决问题的基本思路是最优化其目标函数的期望值,有些书中也称之为期望值模型。

正文见下。

2 数学模型

先看一下确定性优化模型
min f ( x ) s.t g j ( x ) ≤ 0 , j = 1 , 2 , . . . , N \text{min} \quad f(\pmb x) \\ \text{s.t} \quad g_j(\pmb x)≤0, j=1,2,...,N \\ minf(x)s.tgj(x)0,j=1,2,...,N
其中 x \pmb x x是决策变量, f f f是目标函数表达式, g g g是约束条件表达式。

增加随机变量 ξ \pmb \xi ξ后,上述模型就变为不确定优化模型
min E [ f ( x , ξ ) ] s.t E [ g j ( x , ξ ) ] ≤ 0 , j = 1 , 2 , . . . , N \ \text{min} \quad E[f(\pmb x,\pmb \xi)] \nonumber \\ \text{s.t} \quad E[g_j(\pmb x,\pmb \xi)]≤0, j=1,2,...,N \nonumber \\  minE[f(x,ξ)]s.tE[gj(x,ξ)]0,j=1,2,...,N
式中, E E E表示期望,假设 ξ \pmb \xi ξ的概率密度函数为 ϕ ( ξ ) \phi(\pmb \xi) ϕ(ξ),目标函数和约束条件的表达式可以表示为
E [ f ( x , ξ ) ] = ∫ f ( x , ξ ) ϕ ( ξ ) d ξ E [ g j ( x , ξ ) ] = ∫ g j ( x , ξ ) ϕ ( ξ ) d ξ E[f(\pmb x,\pmb \xi)]=\int f(\pmb x,\pmb \xi)\phi(\pmb \xi)d\pmb \xi \\ E[g_j(\pmb x,\pmb \xi)]=\int g_j(\pmb x,\pmb \xi)\phi(\pmb \xi)d\pmb \xi E[f(x,ξ)]=f(x,ξ)ϕ(ξ)dξE[gj(x,ξ)]=gj(x,ξ)ϕ(ξ)dξ
如果 ξ \pmb \xi ξ是离散随机变量,且其分布函数为 P ( ξ = ξ i ) = θ i , i ∈ I P(\pmb \xi=\pmb \xi_i)=\theta_i,i\in I P(ξ=ξi)=θi,iI,目标函数和约束条件的表达式可以表示为
E [ f ( x , ξ ) ] = ∑ i ∈ I θ i f ( x , ξ i ) E [ g j ( x , ξ ) ] = ∑ i ∈ I θ i g j ( x , ξ i ) E[f(\pmb x,\pmb \xi)]=\sum_{i\in I} \theta_i f(\pmb x,\pmb \xi_i) \\ E[g_j(\pmb x,\pmb \xi)]=\sum_{i\in I} \theta_i g_j(\pmb x,\pmb \xi_i) E[f(x,ξ)]=iIθif(x,ξi)E[gj(x,ξ)]=iIθigj(x,ξi)

3 报童问题

有了模型后,我们还需要知道用什么算法可以求解。

本节主要使用报童问题作为实例,来阐述在决策变量只有1个、不确定参数也只有1个的情况下,可以得到最优解的各类算法方案。

报童问题可以描述为:报童每天需要采购一定数量的报纸用于当天的销售。已知每份报纸的成本价 c = 5 c=5 c=5,销售价 p = 8 p=8 p=8,需求量 d d d是个不确定参数,通过历史的数据可知其分布服从正态分布,均值是 μ = 100 \mu=100 μ=100,方差为 σ = 20 \sigma=20 σ=20,如果当天卖不完,会按回收价 s = 4 s=4 s=4将未卖完的报纸卖给回收站。

现在需要确定报童的最佳订购量 x x x,使得报童的净收入 θ ( x ) \theta(x) θ(x)最大化。 θ ( x ) \theta(x) θ(x)的表达式为
θ ( x ) = p ⋅ E [ min ⁡ ( x , d ) ] + s ⋅ E [ max ⁡ ( x − d , 0 ) ] − c x \theta(x)=p·E[\min(x,d)]+s·E[\max(x-d,0)]-cx θ(x)=pE[min(x,d)]+sE[max(xd,0)]cx
第一项是售卖报纸的收益,第二项是回收报纸的收益,第三项是购买报纸的成本。

3.1 直接最优化

常规求解思路是:对 θ ( x ) \theta(x) θ(x)求导使其梯度等于0,即可得到最佳 x x x

但由于公式中涉及到 x x x d d d的大小判断, θ ( x ) \theta(x) θ(x)的导数并不好算,为此,可以先把上面的 x x x转换成一个新的变量 x − d x-d xd,接着转变 θ ( x ) \theta(x) θ(x)的表达式。

  1. 对于 min ⁡ ( x , d ) \min(x,d) min(x,d)项,将其做如下转化
    min ⁡ ( x , d ) = d − max ⁡ ( d − x , 0 ) \min(x,d)=d-\max(d-x,0) min(x,d)=dmax(dx,0)
    上式的正确性可以分 x > d x>d x>d x ≤ d x≤d xd来依次验证: x > d x>d x>d时,左边为 d d d,右边为 d − 0 = d d-0=d d0=d x ≤ d x≤d xd时,左边为 x x x,右边为 d − ( d − x ) = x d-(d-x)=x d(dx)=x

  2. 对于 s ⋅ E [ max ⁡ ( x − d , 0 ) ] s·E[\max(x-d,0)] sE[max(xd,0)]项,不需要调整。

  3. 对于 c x cx cx项,将其做如下转化
    c x = c ( x − d ) + c d = c max ⁡ ( d − x , 0 ) − c max ⁡ ( x − d , 0 ) + c d cx=c(x-d)+cd=c\max(d-x,0)-c\max(x-d,0)+cd cx=c(xd)+cd=cmax(dx,0)cmax(xd,0)+cd
    上式的正确性也可以分 x > d x>d x>d x ≤ d x≤d xd来验证,这里就不赘述了。

  4. 将上述三式重新组合,目标函数 θ ( x ) \theta(x) θ(x)的表达式变为
    θ = ( p − c ) ⋅ E ( d ) − { ( p − c ) ⋅ E [ max ⁡ ( d − x , 0 ) ] + ( c − s ) ⋅ E [ max ⁡ ( x − d , 0 ) ] } \theta=(p-c)·E(d)-\{(p-c)·E[\max(d-x,0)]+(c-s)·E[\max(x-d,0)]\} θ=(pc)E(d){(pc)E[max(dx,0)]+(cs)E[max(xd,0)]}
    定义 b = p − c , h = c − s , α = b ⋅ E [ max ⁡ ( d − x , 0 ) ] + h ⋅ E [ max ⁡ ( x − d , 0 ) ] b=p-c,h=c-s,\alpha=b·E[\max(d-x,0)]+h·E[\max(x-d,0)] b=pc,h=cs,α=bE[max(dx,0)]+hE[max(xd,0)],则最大化 θ \theta θ等价于最小化 α \alpha α

事实上, α \alpha α中的两个表达式也可以分别理解为:因购买量过少导致的脱销损失和因购买量过多导致的滞销损失。此外,从上式中还可以看出,由于 α ≥ 0 \alpha≥0 α0,所以考虑不确定后,期望收益肯定不高于不考虑不确定时的收益值。

为了求得最小化的 α \alpha α,将其表达式求导并令其等于0
b ⋅ E ∂ max ⁡ ( d − x , 0 ) ∂ x + h ⋅ E ∂ max ⁡ ( x − d , 0 ) ∂ x = 0 b·E\frac{\partial \max(d-x,0)}{\partial x}+h·E\frac{\partial \max(x-d,0)}{\partial x}=0 bExmax(dx,0)+hExmax(xd,0)=0
需要注意的是,一维求导一般用 d x dx dx就可以,但是本文已经使用 d d d表示需求量,为了区分,此处使用了 ∂ x \partial x x的形式。

先看第一项。 x ≥ d x ≥ d xd时, max ⁡ ( d − x , 0 ) = 0 \max(d-x,0)=0 max(dx,0)=0,对 x x x求导后是0;当 x < d x < d x<d时, max ⁡ ( d − x , 0 ) = d − x \max(d-x,0)=d-x max(dx,0)=dx,对 x x x求导后是-1。设 x x x的分布概率为 P ( x ) P(x) P(x),第一项可以表示为
b ⋅ E ∂ max ⁡ ( d − x , 0 ) ∂ x = b ∫ x min ⁡ d P ( x ) ⋅ ( − 1 ) d x = − b P r ( x < d ) = − b [ 1 − P r ( d ≤ x ) ] b·E\frac{\partial \max(d-x,0)}{\partial x}=b\int _{x_{\min}}^d P(x)·(-1)dx=-bPr(x < d)=-b[1-Pr(d≤x)] bExmax(dx,0)=bxmindP(x)(1)dx=bPr(x<d)=b[1Pr(dx)]
式中, P r ( d ≤ x ) Pr(d ≤ x) Pr(dx)为累积分布函数。

同理,可以求得第二项为的结果为
h ⋅ E ∂ max ⁡ ( x − d , 0 ) ∂ x = h P r ( d ≤ x ) h·E\frac{\partial \max(x-d,0)}{\partial x}=hPr(d≤x) hExmax(xd,0)=hPr(dx)
将上述两式带回梯度值等于0的等式约束中,可以得到
P r ( d ≤ x ) = b b + h = p − c p − s Pr(d≤x)=\frac{b}{b+h}=\frac{p-c}{p-s} Pr(dx)=b+hb=pspc

这里还有个小的点需要注意,我们要计算的是 P r ( d ≤ x ) Pr(d≤x) Pr(dx),而不是 P r ( x ≤ d ) Pr(x≤d) Pr(xd)。虽然 x x x是决策变量,但是随机变量是 d d d,后续还需要根据 d d d的累积分布函数值反求 x x x

根据之前的定义, b = 1 , h = 3 b=1,h=3 b=1,h=3,此时最优解满足
P r ( d ≤ x ) = b b + h = 0.75 Pr(d≤x)=\frac{b}{b+h}=0.75 Pr(dx)=b+hb=0.75

调用如下代码,可以反算出 x = 113.49 x=113.49 x=113.49

IN [40]: import scipy
IN [41]: scipy.stats.norm.ppf(0.75, loc=100, scale=20)
Out[41]: 113.48979500392163

3.2 样本均值近似

用最优化的方法推导最优解的解析表达式,虽然优雅,但是对数学的要求比较高,而且如果问题复杂度提升了,能否推导出来都是一个问题。

既然如此,数值的方法就也值得一试。其中,最常见的方法,就是样本均值近似。在该方法中,通过抽样的方式把随机变量转变为一组离散参数,这样就可以把不确定优化问题转化为确定优化问题。

以下为使用样本均值近似实现不确定优化的具体代码。首先使用正态分布随机产生100000个 d d d值,然后设置决策变量范围为80~120,依次计算不同决策变量值下的总收益,并将最优解保留下来。

import numpy as npif __name__ == '__main__':# 报童模型参数c = 5s = 4p = 8# 需求分布参数mu = 100sigma = 20d = np.random.normal(mu, sigma, 100000)# 最优解best_f = 0best_x = 0# 遍历所有决策变量x:范围80~120for cur_x in range(80, 120):cur_f = 0# 需求参数for cur_d_index in range(len(d)):cur_d = d[cur_d_index]# 计算当前决策变量和当前需求值时的值cur_f += p * min(cur_x, cur_d) + s * max(cur_x - cur_d, 0) - c * cur_x# 更新最优解if cur_f > best_f:best_f = cur_fbest_x = cur_xprint('best_x: {}, best_f: {}.'.format(best_x, best_f / len(d)))

运行上述代码后,可以得到最佳订购量是113,该值和解析推导的结果是吻合的。

best_x: 113, best_f: 274.4170922340697.

3.3 两阶段规划

相比直接求解原模型,两阶段规划是更常见的求解随机规划问题的方法。该方法在建模时,会把原问题划分为两个阶段,通常第一阶段不包含随机变量,第二阶段包含随机变量。

在报童问题中,第一阶段是:在观测到实际需求 d d d之前,就需要确定订货量 x x x,目标函数表达式为
− c x + E [ Q ( x , d ) ] -cx+E[Q(x,d)] cx+E[Q(x,d)]
此处, E [ Q ( x , d ) ] E[Q(x,d)] E[Q(x,d)]是第二阶段的收益,目前未知,暂时用一个表达式代替。

到了第二阶段,需求量变为已知,此时 x x x也已经确定, E [ Q ( x , d ) ] E[Q(x,d)] E[Q(x,d)]的表达式就明确了
E [ Q ( x , d ) ] = p ⋅ E [ min ⁡ ( x , d ) ] + s ⋅ E [ max ⁡ ( x − d , 0 ) ] E[Q(x,d)]=p·E[\min(x,d)]+s·E[\max(x-d,0)] E[Q(x,d)]=pE[min(x,d)]+sE[max(xd,0)]

把上式带入上上式后,我们发现,和直接建模的目标函数表达式是一模一样的,看起来好像没啥区别。这主要是因为本文所用实例的问题维度比较低,如果问题复杂度变高,两阶段规划模型和原模型就会不一样。后续文章肯定还会再讨论该方案,此处暂时就不再深入了。

3.4 结果分析

前面三节给出了求解期望值模型的三种算法方案,本节针对优化结果再做一些简单分析。

如果不考虑随机性,最优订购量是100,收益是300;考虑随机性后,最优订购量是113,预期收益是274。

预期收益降低,在“解析推导”章节中已经说明了原因,此处不再赘述;本节着重理解为什么考虑随机性后最优订购量增会高于100。

事实上,当 x < d x < d x<d时,脱销损失的系数值 h = 3 h=3 h=3,而 x > d x > d x>d时,滞销损失的系数值 b = 1 b=1 b=1。由于目标函数是最小化脱销损失+滞销损失,所以最优解会高于需求量均值 d = 100 d=100 d=100,可以理解为:宁愿滞销、不能脱销,即宁愿多赔,不能少赚。

如果调整模型参数为 p = 6 , s = 3 p=6,s=3 p=6,s=3,此时滞销损失系数值高于脱销损失系数值,最优订购量小于100,变成91,即宁愿少赚,不能多赔。

4 在线求教

关于文章主题的内容,到这里已经结束了。本节主要是针对我在学习不确定优化过程中,遇到的一些困扰,进行在线求教,有愿意帮忙的大佬可以直接后台联系我。

(1) 需要帮忙勘误。国内关于不确定优化的经典教材或视频教程偏少,我自己也是边学边总结,很担心文章中的一些认知和理解有问题,会误导大家,所以迫切需要这个方向的大佬在我发文前帮忙做一下免费勘误。

(2) 需要RSOME指导。之前有个RSOME的讲座,主要讲的是如何利用RSOME求解鲁棒优化和分布鲁棒优化问题,当时主讲人的意思是RSOME也能用于求解随机规划问题。我目前还没用过RSOME,但很想实践一下并将其优化结果和代码添加至文章中,所以需要有擅长RSOME的大佬帮忙指导一下内容或方向。

在此感谢!

5 相关阅读

报童问题:https://www.jianshu.com/p/dfac740faa34

报童模型两阶段表示:https://blog.csdn.net/robert_chen1988/article/details/79350624

报童问题详细推导及利用Python的SAA方法求解:https://blog.csdn.net/zzzssszzzzsz/article/details/119875340

报童模型——如何做一次性采购的供给决策?:https://www.jianshu.com/p/6c7858159898

这篇关于随机规划:求解报童问题期望值模型的算法方案的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/866816

相关文章

MySQL分表自动化创建的实现方案

《MySQL分表自动化创建的实现方案》在数据库应用场景中,随着数据量的不断增长,单表存储数据可能会面临性能瓶颈,例如查询、插入、更新等操作的效率会逐渐降低,分表是一种有效的优化策略,它将数据分散存储在... 目录一、项目目的二、实现过程(一)mysql 事件调度器结合存储过程方式1. 开启事件调度器2. 创

大数据小内存排序问题如何巧妙解决

《大数据小内存排序问题如何巧妙解决》文章介绍了大数据小内存排序的三种方法:数据库排序、分治法和位图法,数据库排序简单但速度慢,对设备要求高;分治法高效但实现复杂;位图法可读性差,但存储空间受限... 目录三种方法:方法概要数据库排序(http://www.chinasem.cn对数据库设备要求较高)分治法(常

Vue项目中Element UI组件未注册的问题原因及解决方法

《Vue项目中ElementUI组件未注册的问题原因及解决方法》在Vue项目中使用ElementUI组件库时,开发者可能会遇到一些常见问题,例如组件未正确注册导致的警告或错误,本文将详细探讨这些问题... 目录引言一、问题背景1.1 错误信息分析1.2 问题原因二、解决方法2.1 全局引入 Element

关于@MapperScan和@ComponentScan的使用问题

《关于@MapperScan和@ComponentScan的使用问题》文章介绍了在使用`@MapperScan`和`@ComponentScan`时可能会遇到的包扫描冲突问题,并提供了解决方法,同时,... 目录@MapperScan和@ComponentScan的使用问题报错如下原因解决办法课外拓展总结@

MybatisGenerator文件生成不出对应文件的问题

《MybatisGenerator文件生成不出对应文件的问题》本文介绍了使用MybatisGenerator生成文件时遇到的问题及解决方法,主要步骤包括检查目标表是否存在、是否能连接到数据库、配置生成... 目录MyBATisGenerator 文件生成不出对应文件先在项目结构里引入“targetProje

C#使用HttpClient进行Post请求出现超时问题的解决及优化

《C#使用HttpClient进行Post请求出现超时问题的解决及优化》最近我的控制台程序发现有时候总是出现请求超时等问题,通常好几分钟最多只有3-4个请求,在使用apipost发现并发10个5分钟也... 目录优化结论单例HttpClient连接池耗尽和并发并发异步最终优化后优化结论我直接上优化结论吧,

Java内存泄漏问题的排查、优化与最佳实践

《Java内存泄漏问题的排查、优化与最佳实践》在Java开发中,内存泄漏是一个常见且令人头疼的问题,内存泄漏指的是程序在运行过程中,已经不再使用的对象没有被及时释放,从而导致内存占用不断增加,最终... 目录引言1. 什么是内存泄漏?常见的内存泄漏情况2. 如何排查 Java 中的内存泄漏?2.1 使用 J

Golang的CSP模型简介(最新推荐)

《Golang的CSP模型简介(最新推荐)》Golang采用了CSP(CommunicatingSequentialProcesses,通信顺序进程)并发模型,通过goroutine和channe... 目录前言一、介绍1. 什么是 CSP 模型2. Goroutine3. Channel4. Channe

numpy求解线性代数相关问题

《numpy求解线性代数相关问题》本文主要介绍了numpy求解线性代数相关问题,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧... 在numpy中有numpy.array类型和numpy.mat类型,前者是数组类型,后者是矩阵类型。数组

解决systemctl reload nginx重启Nginx服务报错:Job for nginx.service invalid问题

《解决systemctlreloadnginx重启Nginx服务报错:Jobfornginx.serviceinvalid问题》文章描述了通过`systemctlstatusnginx.se... 目录systemctl reload nginx重启Nginx服务报错:Job for nginx.javas