思维模型 纳什均衡

2023-10-30 05:12
文章标签 模型 思维 均衡 纳什

本文主要是介绍思维模型 纳什均衡,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

本系列文章 主要是 分享 思维模型,涉及各个领域,重在提升认知。纳什均衡解释了囚徒困境、智猪博弈、内卷、美苏的军备竞赛等博弈问题。


1 纳什均衡的应用

1.1 经典的 囚徒困境

@1 背景

囚徒困境是一个经典的博弈论问题,主要描述了两个被捕的囚徒在面对警方审讯时的策略选择。

有一天,两个小偷 A 和 B 一起行窃,结果被警察抓住了。警察将他们分别关押在不同的房间里,并告诉他们,如果他们都坦白罪行,每人将被判处 3 年监禁;如果他们都不坦白,每人将被判处 1 年监禁;如果一个坦白一个不坦白,坦白的人将被释放,不坦白的人将被判处 5 年监禁。

@2 策略选择

在这种情况下,A 和 B 都面临着一个艰难的选择。他们可以选择坦白或不坦白,但是无论他们做出什么选择,他们都必须考虑到对方的选择。

如果 A 选择坦白,那么他将被释放,而 B 将被判处 5 年监禁。如果 A 选择不坦白,那么他将被判处 1 年监禁,而 B 将被判处 3 年监禁。同样,如果 B 选择坦白,那么他将被释放,而 A 将被判处 5 年监禁。如果 B 选择不坦白,那么他将被判处 1 年监禁,而 A 将被判处 3 年监禁。

@3 纳什均衡

在这个博弈中,存在一个纳什均衡,即两个参与者都选择坦白。这是因为无论对方选择什么,坦白都是对自己最有利的选择。

虽然两个参与者都选择坦白并不是最优的结果,因为他们都将被判处 3 年监禁,但是在这种情况下,他们都没有动机去改变自己的策略,因为任何一个参与者改变自己的策略都会导致自己的收益减少。

总之,囚徒困境描述了两个被捕的囚徒在面对警方审讯时的策略选择,反映了个人理性与集体理性之间的矛盾。在这个博弈中,存在一个纳什均衡,即两个参与者都选择坦白,虽然这并不是最优的结果,但是在这种情况下,他们都没有动机去改变自己的策略。

1.2 智猪博弈

@1 背景

猪圈里有两头猪,一头大猪,一头小猪。猪圈的一边有个踏板,每踩一下踏板,在远离踏板的猪圈的另一边的投食口就会落下少量的食物。如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。

@2 策略选择

小猪会选择“搭便车”策略,舒舒服服地等在食槽边;而大猪则为一点残羹不知疲倦地奔忙于踏板和食槽之间。

@3 纳什均衡

在这个博弈中,小猪的最佳策略是等待,而大猪的最佳策略是去踩踏板。这个博弈的纳什均衡是大猪去踩踏板,小猪等待,然后大猪和小猪分别获得一半的食物。这个均衡是稳定的,因为任何一方单独改变策略都不会获得更好的结果。

1.3 性别之战

@1 背景

性别之战是纳什均衡在经济学中的一个经典应用,它描述了一个男女之间关于看电影还是看足球比赛的冲突。

一对男女朋友周末想一起出去玩,但是他们对活动的偏好不同。男生喜欢看足球比赛,而女生喜欢看电影。如果他们各自坚持自己的偏好,那么他们可能会发生争吵,最终可能导致不愉快的结果。但是,如果他们能够达成一个妥协,选择一个双方都可以接受的活动,那么他们就可以避免争吵,达成一个纳什均衡。

例如,他们可以选择去看一场电影,然后再去看一场足球比赛,这样他们就可以满足彼此的需求,同时也不会有太大的冲突。

@2 策略选择

在这个博弈中,男女双方都有两种策略:坚持自己的偏好或者妥协。如果他们都坚持自己的偏好,那么他们的收益为0,因为他们没有达成任何共识。如果他们都妥协,那么他们的收益为1,因为他们达成了一个双方都可以接受的协议。如果一个人坚持自己的偏好,而另一个人妥协,那么坚持自己偏好的人的收益为2,而妥协的人的收益为0。

@3 纳什均衡

因此,在这个博弈中,妥协是一个纳什均衡,因为如果一个人妥协,另一个人坚持自己的偏好,那么坚持自己偏好的人会获得更高的收益,而妥协的人会获得更低的收益。因此,双方都没有动机去改变自己的策略,从而达成一个稳定的、自我执行的协议。但如果站在更高的视角来看,第一次 妥协的人第二次可以获得偏好的奖励,那么就可以达成新的动态平衡。

1.4 古诺模型

古诺模型(Cournot model)是早期的寡头模型。它是由法国经济学家古诺于 1838 年提出的。古诺模型是一个只有两个寡头厂商的简单模型,该模型假定一种产品市场上只有两个卖者,并且相互间没有任何勾结行为,但相互间都知道对方将怎样行动,从而各自怎样确定最优的产量来实现利润最大化,因此,古诺模型又称为双头垄断理论。

@1 背景

可口可乐和百事可乐是世界上最大的两家软饮料公司,它们生产的可乐是无差异的,并且市场需求是线性的,即市场上对可乐的需求量随着价格的下降而增加。

@2 策略选择

可口可乐和百事可乐都可以选择生产不同数量的可乐。它们需要考虑自己的产量决策对市场价格和利润的影响,以及对竞争对手的影响。

@3 纳什均衡

在古诺模型中,纳什均衡是指两个厂商都选择自己的最优产量,使得它们的利润最大化。在这种情况下,两个厂商的产量决策是相互依存的,因为它们的产量决策会影响市场价格和对方的利润。

具体来说,假设可口可乐选择生产 x 单位的可乐,百事可乐选择生产 y 单位的可乐。市场总需求量为 D,市场价格为 p。根据市场需求函数,我们可以得到市场价格 p 等于市场总供应量除以市场总需求量,即:

p = (x + y) / D

对于可口可乐和百事可乐,它们的利润等于销售收入减去生产成本,即:

πC = px - cC(x),πP = py - cP(y)

其中,cC(x) 和 cP(y) 分别是可口可乐和百事可乐的生产成本函数。

在纳什均衡下,可口可乐和百事可乐都选择自己的最优产量,使得自己的利润最大化。这意味着,对于可口可乐,它会选择产量 x,使得:dπC / dx = 0

同样地,对于百事可乐,它会选择产量 y,使得:dπP / dy = 0

通过求解这两个方程,我们可以得到纳什均衡下的产量 x* 和 y*。

需要注意的是,古诺模型假设厂商是完全理性的,并且能够准确地预测市场情况。然而,在实际情况中,厂商的决策可能受到多种因素的影响,例如信息不对称、市场不确定性等。因此,古诺模型的结果可能与实际情况有所不同。

1.5 市场进入阻挠博弈

@1 背景

两个电信公司,分别是电信公司 A 和电信公司 B。电信公司 A 是市场上的老牌企业,拥有大量的客户和资源,而电信公司 B 是新进入市场的企业,想要分一杯羹。

@2 策略选择

在这种情况下,电信公司 A 可以选择采取以下策略之一:

  • 合作策略:电信公司 A 可以选择与电信公司 B 合作,共同开发市场,分享资源和利润。
  • 阻挠策略:电信公司 A 可以选择采取阻挠策略,通过降低价格、提供更好的服务等方式,来阻止电信公司 B 进入市场或者减少其市场份额。

@3 纳什均衡

如果电信公司 A 选择合作策略,那么电信公司 B 进入市场的成本将会降低,从而更容易进入市场并获得一定的市场份额。在这种情况下,电信公司 A 和电信公司 B 的利润都会增加,这是一个纳什均衡。

如果电信公司 A 选择阻挠策略,那么电信公司 B 进入市场的成本将会增加,从而更难进入市场或者减少其市场份额。在这种情况下,电信公司 A 的利润会增加,而电信公司 B 的利润会减少,这也是一个纳什均衡。

需要注意的是,在实际情况中,电信公司 A 的策略选择可能受到多种因素的影响,例如市场需求、竞争对手的策略等。因此,电信公司 A 需要根据实际情况来选择最适合自己的策略。

1.6 协调博弈

@1 背景

有两家公司A和B,分别生产同一种产品。如果两家公司都选择生产高质量的产品,那么它们都可以获得较高的利润。这是一个纳什均衡,因为如果一家公司选择生产高质量的产品,另一家公司也不会选择生产低质量的产品,因为这样会降低它们的利润。

@2 策略选择

然而,如果有一家公司选择生产低质量的产品,而另一家公司选择生产高质量的产品,那么生产低质量产品的公司将获得更高的利润,而生产高质量产品的公司将获得更低的利润。因此,生产低质量产品的公司的最优策略是选择生产低质量的产品,而生产高质量产品的公司的最优策略是选择生产高质量的产品。

@3 纳什均衡

在这个博弈中,存在一个纳什均衡,即两家公司都选择生产低质量的产品,这样它们都可以获得相同的收益。然而,这个纳什均衡结果并不一定是最优的结果,因为如果两家公司都选择生产高质量的产品,它们可以获得更高的利润。

这个故事说明了在管理中协调的重要性。如果两家公司能够协调它们的行为,选择生产高质量的产品,那么它们都可以获得更高的利润。这需要公司之间进行沟通和合作,以确保它们的行为是相互协调的。在管理中,协调可以帮助公司避免恶性竞争和不良行为,从而实现更好的合作和共赢。

1.7 懦夫博弈

@1 背景

军备竞赛的懦夫博弈案例中,美国和苏联是两个典型的参与者。

@2 策略选择

在冷战时期,美国和苏联之间的军备竞赛是一个典型的懦夫博弈。两个国家都可以选择增加或减少军事力量,以保护自己的国家利益。如果两个国家都增加军事力量,那么它们将陷入一场恶性循环,导致双方的资源和财富都被浪费在军事上。如果一个国家选择减少军事力量,而另一个国家继续增加军事力量,那么减少军事力量的国家将面临更大的威胁。

@3 纳什均衡

在这个博弈中,存在一个纳什均衡,即两个国家都选择增加军事力量,这样双方都不会受到威胁。这是因为,如果一个国家选择减少军事力量,而另一个国家继续增加军事力量,那么减少军事力量的国家将面临更大的威胁,而增加军事力量的国家也不能获得完全的胜利,因为它也会受到一定的威胁。

然而,这个纳什均衡结果并不一定是最优的结果,因为如果两个国家都选择减少军事力量,它们可以避免资源和财富的浪费,同时也可以避免陷入一场恶性循环。然而,在现实生活中,由于参与者之间的不信任和竞争,纳什均衡可能更容易出现。

2 模型 纳什均衡

2.1 纳什均衡是什么?

纳什均衡是指在非合作博弈中,所有参与者的策略组合构成一个策略组合,其中没有任何一个参与者可以通过单方面改变自己的策略而获得更多的收益,也就是说,在给定其他参与者策略的情况下,每个参与者的策略都是最优的。

纳什均衡的概念是由美国数学家约翰·纳什在 20 世纪 50 年代提出的,它是博弈论中一个非常重要的概念,被广泛应用于经济学、政治学、社会学等领域。

在纳什均衡中,每个参与者都选择了自己的最优策略,从而使整个系统达到了一个稳定的状态。在这种状态下,任何一个参与者都不会有动机去改变自己的策略,因为这样做只会导致自己的收益减少。因此,纳什均衡是一种稳定的、自我执行的协议,它可以帮助参与者在竞争中达成共识,实现共同的利益。

2.2 为什么会有纳什均衡?

纳什均衡的出现是由以下几个因素共同作用的结果:

  • 竞争与合作:在现实生活中,人们之间的关系往往是竞争与合作并存的。在竞争中,人们会采取最优策略来最大化自己的利益;而在合作中,人们会考虑彼此的利益,以达成共同的目标。纳什均衡正是在这种竞争与合作的背景下产生的,它反映了在给定其他参与者策略的情况下,每个参与者的最优策略。
  • 个人理性:在纳什均衡中,每个参与者都被假定为是理性的,即他们会根据自己的利益最大化来选择策略。这种个人理性是纳什均衡存在的前提条件,因为只有当每个参与者都追求自己的利益最大化时,他们才会选择最优策略,从而达成纳什均衡。
  • 策略互动:在纳什均衡中,每个参与者的策略都是相互影响的。一个参与者的策略会影响其他参与者的收益,从而影响他们的策略选择。这种策略互动是纳什均衡存在的关键因素,因为只有当每个参与者的策略相互影响时,他们才会考虑彼此的利益,从而达成共同的目标。
  • 信息不对称:在现实生活中,信息往往是不对称的。不同的参与者可能拥有不同的信息,从而导致他们的策略选择不同。纳什均衡考虑了这种信息不对称的情况,它反映了在给定其他参与者策略的情况下,每个参与者的最优策略。

总之,纳什均衡的出现是由竞争与合作、个人理性、策略互动和信息不对称等因素共同作用的结果。它反映了在给定其他参与者策略的情况下,每个参与者的最优策略,是一种稳定的、自我执行的协议,有助于参与者在竞争中达成共识,实现共同的利益。

2.3 纳什均衡的分类

纳什均衡是指在非合作博弈中,所有参与者的策略组合构成一个策略组合,其中没有任何一个参与者可以通过单方面改变自己的策略而获得更多的收益,也就是说,在给定其他参与者策略的情况下,每个参与者的策略都是最优的。根据不同的分类标准,纳什均衡可以分为以下几类:

  • 纯策略纳什均衡和混合策略纳什均衡:纯策略纳什均衡是指在博弈中,每个参与者都选择一个特定的策略,而混合策略纳什均衡是指在博弈中,每个参与者以一定的概率选择不同的策略。
  • 占优策略纳什均衡和非占优策略纳什均衡:占优策略纳什均衡是指在博弈中,存在一个策略组合,其中每个参与者的策略都是相对于其他策略的最优策略。非占优策略纳什均衡是指在博弈中,不存在一个策略组合,其中每个参与者的策略都是相对于其他策略的最优策略。
  • 对称纳什均衡和非对称纳什均衡:对称纳什均衡是指在博弈中,如果将所有参与者的策略进行对称变换后,仍然是一个纳什均衡。非对称纳什均衡是指在博弈中,不存在一个对称变换,使得变换后的策略组合仍然是一个纳什均衡。
  • 严格纳什均衡和弱纳什均衡:严格纳什均衡是指在博弈中,不存在一个策略组合,其中至少有一个参与者可以通过单方面改变自己的策略而获得更多的收益。弱纳什均衡是指在博弈中,存在一个策略组合,其中至少有一个参与者不能通过单方面改变自己的策略而获得更多的收益。

需要注意的是,纳什均衡并不一定是最优的策略组合,也不一定能够实现社会最优效率。在实际应用中,需要根据具体情况选择合适的策略组合,以实现最优的结果。

3 模型简图

这篇关于思维模型 纳什均衡的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/305799

相关文章

Python基于火山引擎豆包大模型搭建QQ机器人详细教程(2024年最新)

《Python基于火山引擎豆包大模型搭建QQ机器人详细教程(2024年最新)》:本文主要介绍Python基于火山引擎豆包大模型搭建QQ机器人详细的相关资料,包括开通模型、配置APIKEY鉴权和SD... 目录豆包大模型概述开通模型付费安装 SDK 环境配置 API KEY 鉴权Ark 模型接口Prompt

大模型研发全揭秘:客服工单数据标注的完整攻略

在人工智能(AI)领域,数据标注是模型训练过程中至关重要的一步。无论你是新手还是有经验的从业者,掌握数据标注的技术细节和常见问题的解决方案都能为你的AI项目增添不少价值。在电信运营商的客服系统中,工单数据是客户问题和解决方案的重要记录。通过对这些工单数据进行有效标注,不仅能够帮助提升客服自动化系统的智能化水平,还能优化客户服务流程,提高客户满意度。本文将详细介绍如何在电信运营商客服工单的背景下进行

Hadoop集群数据均衡之磁盘间数据均衡

生产环境,由于硬盘空间不足,往往需要增加一块硬盘。刚加载的硬盘没有数据时,可以执行磁盘数据均衡命令。(Hadoop3.x新特性) plan后面带的节点的名字必须是已经存在的,并且是需要均衡的节点。 如果节点不存在,会报如下错误: 如果节点只有一个硬盘的话,不会创建均衡计划: (1)生成均衡计划 hdfs diskbalancer -plan hadoop102 (2)执行均衡计划 hd

Andrej Karpathy最新采访:认知核心模型10亿参数就够了,AI会打破教育不公的僵局

夕小瑶科技说 原创  作者 | 海野 AI圈子的红人,AI大神Andrej Karpathy,曾是OpenAI联合创始人之一,特斯拉AI总监。上一次的动态是官宣创办一家名为 Eureka Labs 的人工智能+教育公司 ,宣布将长期致力于AI原生教育。 近日,Andrej Karpathy接受了No Priors(投资博客)的采访,与硅谷知名投资人 Sara Guo 和 Elad G

Retrieval-based-Voice-Conversion-WebUI模型构建指南

一、模型介绍 Retrieval-based-Voice-Conversion-WebUI(简称 RVC)模型是一个基于 VITS(Variational Inference with adversarial learning for end-to-end Text-to-Speech)的简单易用的语音转换框架。 具有以下特点 简单易用:RVC 模型通过简单易用的网页界面,使得用户无需深入了

透彻!驯服大型语言模型(LLMs)的五种方法,及具体方法选择思路

引言 随着时间的发展,大型语言模型不再停留在演示阶段而是逐步面向生产系统的应用,随着人们期望的不断增加,目标也发生了巨大的变化。在短短的几个月的时间里,人们对大模型的认识已经从对其zero-shot能力感到惊讶,转变为考虑改进模型质量、提高模型可用性。 「大语言模型(LLMs)其实就是利用高容量的模型架构(例如Transformer)对海量的、多种多样的数据分布进行建模得到,它包含了大量的先验

图神经网络模型介绍(1)

我们将图神经网络分为基于谱域的模型和基于空域的模型,并按照发展顺序详解每个类别中的重要模型。 1.1基于谱域的图神经网络         谱域上的图卷积在图学习迈向深度学习的发展历程中起到了关键的作用。本节主要介绍三个具有代表性的谱域图神经网络:谱图卷积网络、切比雪夫网络和图卷积网络。 (1)谱图卷积网络 卷积定理:函数卷积的傅里叶变换是函数傅里叶变换的乘积,即F{f*g}

秋招最新大模型算法面试,熬夜都要肝完它

💥大家在面试大模型LLM这个板块的时候,不知道面试完会不会复盘、总结,做笔记的习惯,这份大模型算法岗面试八股笔记也帮助不少人拿到过offer ✨对于面试大模型算法工程师会有一定的帮助,都附有完整答案,熬夜也要看完,祝大家一臂之力 这份《大模型算法工程师面试题》已经上传CSDN,还有完整版的大模型 AI 学习资料,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

【生成模型系列(初级)】嵌入(Embedding)方程——自然语言处理的数学灵魂【通俗理解】

【通俗理解】嵌入(Embedding)方程——自然语言处理的数学灵魂 关键词提炼 #嵌入方程 #自然语言处理 #词向量 #机器学习 #神经网络 #向量空间模型 #Siri #Google翻译 #AlexNet 第一节:嵌入方程的类比与核心概念【尽可能通俗】 嵌入方程可以被看作是自然语言处理中的“翻译机”,它将文本中的单词或短语转换成计算机能够理解的数学形式,即向量。 正如翻译机将一种语言

AI Toolkit + H100 GPU,一小时内微调最新热门文生图模型 FLUX

上个月,FLUX 席卷了互联网,这并非没有原因。他们声称优于 DALLE 3、Ideogram 和 Stable Diffusion 3 等模型,而这一点已被证明是有依据的。随着越来越多的流行图像生成工具(如 Stable Diffusion Web UI Forge 和 ComyUI)开始支持这些模型,FLUX 在 Stable Diffusion 领域的扩展将会持续下去。 自 FLU