列生成(column generation)的应用问题

2024-04-21 20:08

本文主要是介绍列生成(column generation)的应用问题,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

当我们讨论列生成算法,一定要了解一个经典问题——木材下料问题(The cutting stock problem),最初问题的形式为线性规划,相关的问题解析有很多:

优化 | 从集合划分问题到列生成算法

单纯形法和列生成算法解释

线性规划技巧: 列生成(Column Generation)

列生成算法求解矩形下料问题(Matlab代码)

列生成和分支定价

从木材下料问题向外拓展,列生成算法也被用于大规模的线性规划问题,这些问题有以下特征:

  • 大规模意味着变量特别多,很难一次性完全的考虑进来;
  • 只有一小部分变量值是非零的(基变量),大部分变量值为零(非基变量);
  • 只有部分变量可以改善目标函数。

这篇文章主要想把重心放在,当应用列生成算法时会遇到的一些问题及可能的解决方案。

抽象来说,列生成的思路是在子区域(只包含部分列)先生成一个MVP(也就是可行但不是最优的策略),再去寻找可能减少差额成本/非基变量检验数(reduced cost)的列,可行的话就将这个列加入原本的策略中(微调策略)并更新所有列的cost,继续迭代寻找,直到找到最优的策略。

具体来说,在确定要解决的主问题(MP)之后,需要进行几个关键步骤:

  1. 分解问题(Master Problem,MP)为限制主问题(Restricted Master Problem,RMP)与估价问题/子问题(Pricing Problem,PP);
  2. 在每次迭代中,PP通过reduce cost(dual cost)来判断是否有RMP中未涉及到的列(column/independent set)可以改善整个策略。
  3. 如果有则将这个列与cost一同加入当前的RMP,重新计算cost。
  4. 一直迭代到目标函数接近最优。

所以,这个过程中将会涉及到很多个具体问题:

  • 如何拆分原主问题(MP)?
  • 列如何定义?
  • reduce cost如何定义?
  • 最开始的子区域是如何选择的?
  • 如何迭代求解最优的策略?
  • 如何判断其接近最优?

而且,即使是这样的整数线性规划问题,随着问题规模的增大,求解的时间也会是难以接受的。如何尽量减少求解的时间?

实际生活中,遇到的问题也并不如木材下料问题那么规整,可能伴随着大量显式或隐式的constraint,我们又如何处理它们?

如何拆分原主问题(MP)?列如何定义?

这两个问题几乎是等价的,当你确定了列的定义,也就知道如何拆分主问题了,因为所求的RMP形式上一般都满足求某个子区域内的向量的线性组合,这个向量一般就是列生成算法中所说的“列”。

所以列可以理解为是最终策略的一个元素,而最终策略,需要集合多种不同的元素达到最优化。换言之,如果最终想要得到的方案一般是一个整体的优化方案,比如最大流问题,路径规划问题等。

有些情况下,列的定义可以是与时间t相关的函数,这种方法比较取巧。

有些问题的拆分是逻辑上自然而然的,因为很容易找到有现成求解办法又使问题规模变小的RMP。比如在木材下料问题中,主问题是最小化切割方案的cost,cost被定义为浪费的木材长度。一条固定长度的木材的切割方案自然地可以通过穷举来得到。所以MP被转化为了选择切割方案的线性组合,这是典型的线性规划问题。切割方案也就是列,组合的weight自然与cost(所浪费的木材长度)所挂钩。

但在一些问题上,RMP和PP的定义是相当困难的。不一定一开始就能找到所有的方案再从中寻找,而是需要特殊的Price model去限制。

reduce cost如何定义?

通常,想要找到这个reduce cost要通过对偶理论来实现。

找到reduce cost之后就可以定义Price model。当然也有特殊结构的price model,个人认为这是整个算法中最难定义的一部分。具体怎么实现,目前还没有完全参透,先留一个坑,之后来填。

最开始的子区域是如何选择的?

在大部分情况下,最初的区域(initial set)是不会影响最终的优化结果,但它在一定程度上会影响整个算法收敛的速度。

如果最初的区域很小很简单,算法在一开始的迭代过程中将很容易提升,lower bound与upper bound的gap将很快缩小。

如何迭代求解最优的策略?

不停地向RMP加入新的列,再求解RMP。

其中,求解RMP的方法可以是任何算法,只要可以找到reduce cost为负的可行解就行。一般建模为哪类问题,就用哪类问题的常规解法即可。

但是,也存在退化现象,也就是说原问题的对偶问题的对偶最优解不是唯一的,找到的列往往不能改善目标函数值。减少退化现象的影响之一就是不使用对偶问题的基解而是使用对偶问题定义域中的内点解。

可以考虑一次加很多列减弱退化,不需要每次都求到最小的reduce cost,除了动态规划方法,·也可以涉及启发式的规则去解,只要保证负的就行。

如何判断其接近最优?

直到子问题的解全部为非负,则为整体收敛了。

但很多情况下,由于问题规模太大,当迭代到非负时,已经耗费了大量的时间与计算资源了。此时,可以用各种bounded算法去限制计算的精度,常用的有\epsilon-bounded。

 

 

这篇关于列生成(column generation)的应用问题的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/923932

相关文章

IDEA和GIT关于文件中LF和CRLF问题及解决

《IDEA和GIT关于文件中LF和CRLF问题及解决》文章总结:因IDEA默认使用CRLF换行符导致Shell脚本在Linux运行报错,需在编辑器和Git中统一为LF,通过调整Git的core.aut... 目录问题描述问题思考解决过程总结问题描述项目软件安装shell脚本上git仓库管理,但拉取后,上l

idea npm install很慢问题及解决(nodejs)

《ideanpminstall很慢问题及解决(nodejs)》npm安装速度慢可通过配置国内镜像源(如淘宝)、清理缓存及切换工具解决,建议设置全局镜像(npmconfigsetregistryht... 目录idea npm install很慢(nodejs)配置国内镜像源清理缓存总结idea npm in

pycharm跑python项目易出错的问题总结

《pycharm跑python项目易出错的问题总结》:本文主要介绍pycharm跑python项目易出错问题的相关资料,当你在PyCharm中运行Python程序时遇到报错,可以按照以下步骤进行排... 1. 一定不要在pycharm终端里面创建环境安装别人的项目子模块等,有可能出现的问题就是你不报错都安装

idea突然报错Malformed \uxxxx encoding问题及解决

《idea突然报错Malformeduxxxxencoding问题及解决》Maven项目在切换Git分支时报错,提示project元素为描述符根元素,解决方法:删除Maven仓库中的resolv... 目www.chinasem.cn录问题解决方式总结问题idea 上的 maven China编程项目突然报错,是

Python爬虫HTTPS使用requests,httpx,aiohttp实战中的证书异步等问题

《Python爬虫HTTPS使用requests,httpx,aiohttp实战中的证书异步等问题》在爬虫工程里,“HTTPS”是绕不开的话题,HTTPS为传输加密提供保护,同时也给爬虫带来证书校验、... 目录一、核心问题与优先级检查(先问三件事)二、基础示例:requests 与证书处理三、高并发选型:

利用Python操作Word文档页码的实际应用

《利用Python操作Word文档页码的实际应用》在撰写长篇文档时,经常需要将文档分成多个节,每个节都需要单独的页码,下面:本文主要介绍利用Python操作Word文档页码的相关资料,文中通过代码... 目录需求:文档详情:要求:该程序的功能是:总结需求:一次性处理24个文档的页码。文档详情:1、每个

前端导出Excel文件出现乱码或文件损坏问题的解决办法

《前端导出Excel文件出现乱码或文件损坏问题的解决办法》在现代网页应用程序中,前端有时需要与后端进行数据交互,包括下载文件,:本文主要介绍前端导出Excel文件出现乱码或文件损坏问题的解决办法,... 目录1. 检查后端返回的数据格式2. 前端正确处理二进制数据方案 1:直接下载(推荐)方案 2:手动构造

k8s admin用户生成token方式

《k8sadmin用户生成token方式》用户使用Kubernetes1.28创建admin命名空间并部署,通过ClusterRoleBinding为jenkins用户授权集群级权限,生成并获取其t... 目录k8s admin用户生成token创建一个admin的命名空间查看k8s namespace 的

Python绘制TSP、VRP问题求解结果图全过程

《Python绘制TSP、VRP问题求解结果图全过程》本文介绍用Python绘制TSP和VRP问题的静态与动态结果图,静态图展示路径,动态图通过matplotlib.animation模块实现动画效果... 目录一、静态图二、动态图总结【代码】python绘制TSP、VRP问题求解结果图(包含静态图与动态图

MyBatis/MyBatis-Plus同事务循环调用存储过程获取主键重复问题分析及解决

《MyBatis/MyBatis-Plus同事务循环调用存储过程获取主键重复问题分析及解决》MyBatis默认开启一级缓存,同一事务中循环调用查询方法时会重复使用缓存数据,导致获取的序列主键值均为1,... 目录问题原因解决办法如果是存储过程总结问题myBATis有如下代码获取序列作为主键IdMappe