博弈论——议价博弈(Bargaining)

2023-10-07 06:28

本文主要是介绍博弈论——议价博弈(Bargaining),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

议价博弈(Bargaining)

0 引言

议价(bargaining) 是市场经济中最常见的事情,也是博弈论最早研究的问题。这里介绍一种议价的动态博弈模型。同样地,对于动态博弈模型,我们还是用常见的逆推归纳法去寻找该博弈的子博弈完美纳什均衡。

1 议价博弈

    议价博弈有很多种情况,因为议价其实就是一个反复讨价还价的过程,有些人一发即中,有些人讨价还价一小时也不一定有结果,那这里我们简单介绍一下三回合的议价博弈,大家看懂后,也就能根据该博弈去推导四回合、五回合甚至是无限回合的议价博弈了。
    甲乙两人谈判分1万元现金,定下了如此规则:先由甲提出分配方案,乙接受则议价结束,拒绝则由乙提方案;后一种情况如果甲接受乙的方案议价结束,拒绝则由甲提新方案,此时乙不再有拒绝权,必须接受。再设由于谈判费用和利息损失等,议价每多进行一个回合,双方分得现金都有一个消耗系数 δ ( 0 < δ < 1 ) δ(0<δ<1) δ(0<δ<1)

该议价博弈可以描述为:
第一回合:
甲提出方案,甲得 S 1 S_1 S1,乙得 10000 − S 1 10000-S_1 10000S1
如果乙接受,则甲得益为 S 1 S_1 S1,乙得益为 10000 − S 1 10000-S_1 10000S1;若乙不接受,则进行第二回合议价。
第二回合:
乙提出方案,甲得 S 2 S_2 S2,乙得 10000 − S 2 10000-S_2 10000S2
如果甲接受,则甲得益为 δ S 2 δS_2 δS2,乙得益为 δ ( 10000 − S 2 ) δ(10000-S_2) δ(10000S2);若甲不接受,则进行第三回合议价。
第三回合:
甲提出方案,甲得 S S S,乙得 10000 − S 10000-S 10000S
在该回合,不论甲提出什么样的方案,乙都必须接受。则甲得益为 δ 2 S δ^2 S δ2S,乙得益为 δ 2 ( 10000 − S ) δ^2 (10000-S) δ2(10000S)

2 求解议价博弈

使用逆推归纳法进行求解。假设用 π i j π_i^j πij表示第 j j j回合中,博弈方 i i i的得益,其中 i ∈ { 甲 , 乙 } , j ∈ { 1 , 2 , 3 } i∈\{甲,乙\},j∈\{1,2,3\} i{,}j{1,2,3}
(1)先求解第三回合,在该回合甲提出方案,甲得 S S S,乙得 10000 − S 10000-S 10000S,并且乙都必须接受。则甲得益为 π 甲 3 = δ 2 S π_甲^3=δ^2 S π3=δ2S,乙得益为 π 乙 3 = δ 2 ( 10000 − S ) π_乙^3=δ^2 (10000-S) π3=δ2(10000S)。有读者会反应过来,在该回合甲完全可以提出自己得10000元,是的,没错,但是为了更好地使用逆推归纳法,让模型更有一般性,我们还是假设第三回合甲得S,而不是10000
(2)再到第二回合,该回合乙提方案,但为了让甲能够接受,在乙方案下甲的得益必须要不小于第三回合甲的得益,且乙要让自己的得益尽可能大,即需要满足以下两个条件:
π 甲 2 ≥ π 甲 3 ( 1 ) π_甲^2≥π_甲^3 \quad\quad (1) π2π3(1)
m a x s 2 π 乙 2 = m a x s 2 [ δ ( 10000 − S 2 ) ] ( 2 ) \underset{s_2}{max} π_乙^2 =\underset{s_2}{max} [δ(10000-S_2 )] \quad\quad (2) s2maxπ2=s2max[δ(10000S2)](2)
根据上面的方程(1),就进一步有:
δ S 2 ≥ δ 2 S ⇒ S 2 ≥ δ S δS_2≥δ^2 S⇒ S_2≥δS δS2δ2SS2δS
但又因为乙需要让自己的得益尽可能大,即让 ( 10000 − S 2 ) (10000-S_2) (10000S2)尽可能大,所以 S 2 S_2 S2取最小值,即
S 2 = δ S S_2=δS S2=δS
将该式代入方程(2)中得到:
m a x s 2 π 乙 2 = m a x s 2 [ δ ( 10000 − δ S ) ] \underset{s_2}{max}π_乙^2 =\underset{s_2}{max} [δ(10000-δS)] s2maxπ2=s2max[δ(10000δS)]
所以第二回合:
π 甲 2 = δ S π_甲^2=δS π2=δS
π 乙 2 = δ ( 10000 − δ S ) = 10000 δ − δ 2 S π_乙^2=δ(10000-δS)=10000δ-δ^2 S π2=δ(10000δS)=10000δδ2S很明显甲在第二回合的得益不小于(等于)第三回合的得益,而乙在第二回合的得益大于第三回合的得益,即 δ ( 10000 − δ S ) ≥ δ 2 ( 10000 − S ) δ(10000-δS)≥δ^2 (10000-S) δ(10000δS)δ2(10000S)
(3)最后回到第一回合,第一回合由甲提出方案,并且甲知道 π 甲 2 = δ S , π 乙 2 = δ ( 10000 − δ S ) π_甲^2=δS,π_乙^2=δ(10000-δS) π2=δSπ2=δ(10000δS)。因此,同样根据第二回合的思路,由于在该回合是由甲提方案,因此为了让乙能够同意,乙需要得到不低于在第二回合的得益,而甲也需要让自己的得益尽可能大,即满足以下条件:
π 乙 1 ≥ π 乙 2 ( 3 ) π_乙^1≥π_乙^2\quad\quad(3) π1π2(3)
m a x s 1 π 甲 1 = m a x s 1 S 1 \underset{s_1}{max}π_甲^1 =\underset{s_1}{max} S_1 s1maxπ1=s1maxS1
因此根据公式(3)就有了
10000 − S 1 ≥ 10000 δ − δ 2 S 10000-S_1≥10000δ-δ^2 S 10000S110000δδ2S

S 1 ≤ 10000 − 10000 δ + δ 2 S S_1≤10000-10000δ+δ^2 S S11000010000δ+δ2S
又因为 m a x s 1 S 1 \underset{s_1}{max} S_1 s1maxS1,因此
π 甲 1 = S 1 = 10000 − 10000 δ + δ 2 S π_甲^1=S_1=10000-10000δ+δ^2 S π1=S1=1000010000δ+δ2S
π 乙 1 = 10000 δ − δ 2 S π_乙^1=10000δ-δ^2 S π1=10000δδ2S
所以,根据逆推归纳法得的结果,很明显:
π 甲 1 ≥ π 甲 2 ≥ π 甲 3 π_甲^1≥π_甲^2≥π_甲^3 π1π2π3
π 乙 1 ≥ π 乙 2 ≥ π 乙 3 π_乙^1≥π_乙^2≥π_乙^3 π1π2π3
其中 π 甲 1 = 10000 − 10000 δ + δ 2 S , π 甲 2 = δ S , π 甲 3 = δ 2 S , π 乙 1 = 10000 δ − δ 2 S , π 乙 2 = 10000 δ − δ 2 S , π 乙 3 = δ 2 ( 10000 − S ) π_甲^1=10000-10000δ+δ^2 S,π_甲^2=δS,π_甲^3=δ^2 S, π_乙^1=10000δ-δ^2 S,π_乙^2=10000δ-δ^2 S,π_乙^3=δ^2 (10000-S) π1=1000010000δ+δ2Sπ2=δSπ3=δ2Sπ1=10000δδ2Sπ2=10000δδ2Sπ3=δ2(10000S)
所以此时的 ( π 甲 1 , π 乙 1 ) = ( 10000 − 10000 δ + δ 2 S , 10000 δ − δ 2 S ) (π_甲^1,π_乙^1)=(10000-10000δ+δ^2 S,10000δ-δ^2 S) (π1,π1)=(1000010000δ+δ2S,10000δδ2S)是该博弈的子博弈完美纳什均衡。

3 灵敏度分析

在前面我们也提到过,第三回合因为不管甲提啥方案,乙都必须接受,所以甲可以在第三回合让自己的得益 S = 10000 S=10000 S=10000,将该变量代入到 ( π 甲 1 , π 乙 1 ) = ( 10000 − 10000 δ + δ 2 S , 10000 δ − δ 2 S ) (π_甲^1,π_乙^1)=(10000-10000δ+δ^2 S,10000δ-δ^2 S) (π1,π1)=(1000010000δ+δ2S,10000δδ2S)可以得到
( π 甲 1 , π 乙 1 ) = [ 10000 ( 1 − δ + δ 2 ) , 10000 ( δ − δ 2 ) ] (π_甲^1,π_乙^1)=[10000(1-δ+δ^2 ),10000(δ-δ^2)] (π1,π1)=[10000(1δ+δ2),10000(δδ2)]
可以发现,双方的最终得益其实是取决于消耗系数的。我们将结果中的 1 − δ + δ 2 以及 δ − δ 2 1-δ+δ^2以及δ-δ^2 1δ+δ2以及δδ2拿出来,以函数的形式进行绘制,如下图所示:
在这里插入图片描述

可以发现,两图像均关于 δ = 0.5 δ=0.5 δ=0.5对称,越接近1,代表甲越不怕旷日持久谈判,甲越接近能得到全部利益。 δ δ δ越接近0,代表乙的争夺越接近会毁掉全部价值,甲也越接近得到全部利益。乙分得的利益与 δ − δ 2 δ-δ^2 δδ2正相关,当 δ = 0.5 δ=0.5 δ=0.5时, δ − δ 2 δ-δ^2 δδ2有最大值0.25,此时乙可以分得最多的2500元。因此消耗系数δ是乙议价的关键筹码 δ = 0.5 δ=0.5 δ=0.5,也就是多进行一个回合会折损一半价值的折损率,给乙带来的议价能力最大。

4 模型扩展——无限回合议价博弈

无限回合议价博弈假设议价过程不会在第三回合被强制结束,只要双方互不接受对方的出价方案,议价就不断进行下去,奇数回合由甲出价,乙选择是否接受,偶数回合由乙出价,甲选择接受与否,这可理解成缺乏有强制效力司法仲裁的情况。
无限回合议价博弈没有可作为逆推归纳分析起始点的最后回合,按常规思路无法运用逆推归纳法进行求解。但是请注意,如果结合三回合议价模型进行分析,根据从第三回合开始的无限回合议价博弈和从第一回合开始的相同这一关键点,这个难题就可以下手了。
先假设该博弈有一个逆推归纳解,其中甲和乙得益分别为S和10000-S,即甲第一回合提出S,乙接受。从第三回合开始这个无限回合博弈的结果与从第一回合开始一样,即甲第三回合提出S,乙接受,双方得益 S S S 10000 − S 10000-S 10000S
由于甲在第三回合的出价是甲得 S S S、乙得 10000 − S 10000-S 10000S,而我们前面假设该博弈存在逆推归纳解,且该解与第三回合的解相同,因此这个无限回合博弈相当于三回合议价模型,即该模型演变为甲的第三回合出价有强制力的三回合议价博弈。根据三回合议价博弈的逆推归纳法结论可知,该博弈的解是甲在第一回合提出的 S 1 = 10000 − 10000 δ + δ 2 S S_1=10000-10000δ+δ^2 S S1=1000010000δ+δ2S,乙接受,双方得益为 ( π 甲 1 , π 乙 1 ) = ( 10000 − 10000 δ + δ 2 S , 10000 δ − δ 2 S ) (π_甲^1,π_乙^1)=(10000-10000δ+δ^2 S,10000δ-δ^2 S) (π1,π1)=(1000010000δ+δ2S,10000δδ2S)
由于这个三回合博弈等于从第一回合开始的无限回合议价博弈,因此, S = S 1 = 10000 − 10000 δ + δ 2 S S=S_1=10000-10000δ+δ^2 S S=S1=1000010000δ+δ2S,求解得 S = 10000 / ( 1 + δ ) S=10000/(1+δ) S=10000/(1+δ),因此均衡结果为
π 甲 = 10000 / ( 1 + δ ) π_甲=10000/(1+δ) π=10000/(1+δ)
π 乙 = 10000 − 10000 / ( 1 + δ ) = 10000 δ / ( 1 + δ ) π_乙=10000-10000/(1+δ)=10000δ/(1+δ) π=1000010000/(1+δ)=10000δ/(1+δ)

这篇关于博弈论——议价博弈(Bargaining)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/156634

相关文章

poj2505(典型博弈)

题意:n = 1,输入一个k,每一次n可以乘以[2,9]中的任何一个数字,两个玩家轮流操作,谁先使得n >= k就胜出 这道题目感觉还不错,自己做了好久都没做出来,然后看了解题才理解的。 解题思路:能进入必败态的状态时必胜态,只能到达胜态的状态为必败态,当n >= K是必败态,[ceil(k/9.0),k-1]是必胜态, [ceil(ceil(k/9.0)/2.0),ceil(k/9.

hdu3389(阶梯博弈变形)

题意:有n个盒子,编号1----n,每个盒子内有一些小球(可以为空),选择一个盒子A,将A中的若干个球移到B中,满足条件B  < A;(A+B)%2=1;(A+B)%3=0 这是阶梯博弈的变形。 先介绍下阶梯博弈: 在一个阶梯有若干层,每层上放着一些小球,两名选手轮流选择一层上的若干(不能为0)小球从上往下移动,最后一次移动的胜出(最终状态小球都在地面上) 如上图所示,小球数目依次为

AI模型的未来之路:全能与专精的博弈与共生

人工智能(AI)领域正迅速发展,伴随着技术的不断进步,AI模型的应用范围也在不断扩展。当前,AI模型的设计和使用面临两个主要趋势:全能型模型和专精型模型。这两者之间的博弈与共生将塑造未来的AI技术格局。本文将从以下七个方面探讨AI模型的未来之路,并提供实用的代码示例,以助于研究人员和从业者更好地理解和应用这些技术。 一、AI模型的全面评估与比较 1.1 全能型模型 全能型AI模型旨在在多

简单取石子游戏~博弈

很坑爹的小游戏,至于怎么坑爹,嘎嘎~自己研究去吧~! #include<stdio.h>#include<windows.h>#include<iostream>#include<string.h>#include<time.h>using namespace std;void Loc(int x,int y);/*定位光标*/void Welcome(); /*创建欢迎界面*/

综合评价 | 基于熵权-变异系数-博弈组合法的综合评价模型(Matlab)

目录 效果一览基本介绍程序设计参考资料 效果一览 基本介绍 根据信息熵的定义,对于某项指标,可以用熵值来判断某个指标的离散程度,其信息熵值越小,指标的离散程度越大, 该指标对综合评价的影响(即权重)就越大,如果某项指标的值全部相等,则该指标在综合评价中不起作用。因此,可利用信息熵这个工具,计算出各个指标的权重,为多指标综合评价提供依据。 变异系数只在平均值不为

“苹果税”引发的苹果与腾讯、字节跳动之间的纷争与博弈

北京时间9月10日凌晨一点的Apple特别活动日渐临近,苹果这次将会带来iPhone16系列新品手机及其他硬件产品的更新,包括iPad、Apple Watch、AirPods等。从特别活动的宣传图和宣传标语“閃亮時刻”来看,Apple Intelligence将会是史上首次推出,无疑将会是iOS 18的重头戏和高光时刻。 不过就在9月2日,一则“微信可能不支持iPhone16”的

美业收银系统怎么选择?博弈美业系统展示、美业SaaS管理系统源码戳

美业收银系统是一种专为美容、美发、美甲、SPA等美业门店设计的全面性结账解决方案,其重要性在于它为门店提供了全面的业务管理功能。美业收系统可以处理销售、预约管理、库存追踪和员工绩效等多项任务,不仅能够简化交易流程,还能提高门店管理效率,是提升门店竞争力和盈利能力的利器。 一套优秀的美业收银系统要专业、智能、高效、便捷!博弈美业包括PC、pad、手机APP、小程序四大端口,一套系统解决连锁美业多种

智能对决:提示词攻防中的AI安全博弈

智能对决:提示词攻防中的AI安全博弈 在2024年上海AIGC开发者大会上,知名提示词爱好者工程师云中嘉树发表了关于AI提示词攻防与安全博弈的精彩演讲。他深入探讨了当前AI产品的安全现状,提示词攻击的常见手段及其应对策略。本文将对他的演讲进行详细的解读与分析,并结合实际案例和技术手段,探讨如何在AI应用开发中提高安全性。 1. AI产品安全现状 随着大模型(如GPT系列)和AI应用的普及,A

综合评价 | 基于层次-熵权-博弈组合法的综合评价模型(Matlab)

目录 效果一览基本介绍程序设计参考资料 效果一览 基本介绍 AHP层次分析法是一种解决多目标复杂问题的定性和定量相结合进行计算决策权重的研究方法。该方法将定量分析与定性分析结合起来,用决策者的经验判断各衡量目标之间能否实现的标准之间的相对重要程度,并合理地给出每个决策方案的每个标准的权数,利用权数求出各方案的优劣次序,比较有效地应用于那些难以用定量方法解决的课题

拍卖与博弈:计算广告中的底价问题

流量变现和RTB 现代计算广告中,最广泛的流量交易模式为实时竞价模式,即Real-Time-Bidding(RTB)。实时竞价顾名思义,就是在流量到达时被放到交易市场进行公开的,实时的竞拍,参与竞拍的广告主赢得竞拍后,即可获得对这个流量的投放权,整个流程如图示。 以新浪微博的信息流广告为例,当我们刷微博时,微博的信息流(或者timeline)中会夹杂着广告,假设微博将信息流的第4和第10位作为