本文主要是介绍【博弈论1——认识博弈论】,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
1. 什么是博弈论
博弈论
- 是运筹学的一个分支,是一门以数学为基础,研究发生对抗与冲突时如何选择最优策略的学问。
- 是交互式条件下“最优理性决策”
- 精髓在于基于系统思维基础上的理性换位思考
重要的思维方式
2. 博弈的类型
- 按照是否有协议
- 合作博弈
- 非合作博弈(经济学习中常指)
- 按照参与人是否得到全部信息
- 完全信息博弈
- 不完全信息博弈
- 按参与者行动的先后顺序
- 静态博弈
- 动态博弈
- 收益是否为常数
- 常和博弈
- 非常和博弈
- 是否结盟
- 结盟博弈
- 不结盟博弈
3.细解囚徒困境问题
囚徒困境(Prisoner’s Dilemma)是一种经典的博弈论模型,用于描述两个个体在追求自身利益最大化的过程中,由于无法信任对方的合作意愿而导致双方共同结局不如各自最优选择下的集体最优的情况。这个模型假设如下情境:
设想有两个共谋犯罪的囚犯被单独审讯且不能沟通。检察官提供了两种选择给每个囚犯:
- 如果两个囚犯都保持沉默(合作),由于缺乏足够的证据,他们可能每人会被判处较轻的刑期。
- 如果一个囚犯背叛(认罪并指证对方),而另一个囚犯保持沉默,背叛者将获得豁免或轻微惩罚,而沉默的囚犯将受到严重惩罚。
- 如果两个囚犯都背叛对方,则由于双方都有认罪的证据,他们都将受到中等程度的惩罚,但比他们两人合作时的刑期要重。
在这个博弈中,每一个囚犯从个人角度看,无论对方选择什么,自己的最佳策略都是背叛,因为背叛至少可以避免最糟糕的结果(即被对方背叛时坐牢最久)。然而,当两人都按照个人最佳策略行动(即都背叛对方)时,他们实际上得到了次优的结果,因为他们本来可以通过合作(都保持沉默)来得到更轻的刑期。
囚徒困境揭示了在一次性的、非重复的交互中,个体理性可能导致集体非理性的现象,以及在缺乏信任和有效沟通的情况下,合作是难以维持的。
4. 博弈论的基本概念
- 基本假设
- 强调个人理性,做出合乎理性的行为
- 三个基本要素
- 局中人(Player)
- 策略与策略集
- 支付与支付函数
- 支付(payoff)
- 支付函数(payoff function)
- 其他要素
- 信息
- 结果
- 均衡
表述模型
- 标准式
- 适合表示二、三人博弈的列表形式
- 扩展式
- 可表示多人博弈(动态多人博弈)的博弈树形式
- 特征函数式
- 出现在合作博弈的一般表示中
标准式和扩展式是等价的,可以相互转换。
这篇关于【博弈论1——认识博弈论】的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!