耶鲁大学《博弈论》公开课笔记

2024-09-01 16:20

本文主要是介绍耶鲁大学《博弈论》公开课笔记,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

关于本文

该文章基于本人于当天白天看完耶鲁大学《博弈论》公开课后,于当晚记录下依然记得的白天所听内容。该文章为汇总,时间为记录一年后。

目录

    • 关于本文
    • 2023.3.18 P10
    • 3.19 P11
    • 3.20 P12
    • 3.21 P13
    • 3.22 P14
    • 3.23 P15
    • 3.24 P16
    • 3.25 P17
    • 3.26 P18
    • 3.27 P19
    • 3.28 P20
    • 3.29 P21
    • 3.30 P22
    • 3.31 P23
    • 4.1 P24

2023.3.18 P10

混合策略收益一定不高于等于某一纯策略;

在已有博弈中,两种选择收益一定是一样的,否则平衡会被打破;而至选择一种选择,一方的选择取决于对方收益。

因此提高纳税率只能考提高审纳员工资,提高偷税罚款只能降低审查率。

3.19 P11

生物进化均衡点(EN)是双纳什均衡中某个点。

有某已经形成NE(纳什均衡)的种群,新突变体可能让NE向EN对应的NE移动

3.20 P12

HD
H(v+2)/2,(v+c)/2v,0
D0,vv/2,v/2

若v>c,则最后只剩下H;若v=c,H收益仍大于D’D’=v/2,故还是只有H;

若c>v,设 H对P 与 D对P 收益相关,则

H: P(v-c)/2+(1-p)v/2 设H=P -> P=v/c;

D: Px0+(1-p)v/2 其为混合NE;

发生争斗的可能性为(v/c)^2 , D的收益是 (1-v/c)(v/2) ,当C上升,收益增加,H结果一样

3.21 P13

按后序分析法,投资1元或者3元或者卷款跑路:

第一个人只能投1元,否则第二个人必卷款跑路;

即使调整收益(让利给第二人),第二人也会用3个1元代替3元来求得更高汇报。

然后是诺曼VS撒克逊战争:

诺曼选择烧船或不烧船,不烧,撒克逊也可选战斗或者逃跑,此时诺曼人也可选战斗或逃跑,最后可以得到撒克逊一定防守,因为跑了的话对方收益更高。

或者诺曼人烧船,此时进入破釜沉舟阶段。

抵押贷款的目的不在于对方真的想要拿到你的赔偿,而是增大你的失信成本,让对方更有底气借款。

3.22 P14

在两家对抗的生产博弈中,一家提高产量,另一家就不得不减少产量,因为市场不变,继续生产就会导致利润下降(如果都继续增产,就会进入价格战)

所以在这一模型里,先下手为强。

如果乙往甲里面安排间谍,其不会受益,因为这样会让自己被动。所以信息不是越多越好,先下手也可能更好。

但不是任何时候,比如石头剪刀布,先下手就不好。

3.23 P15

国际象棋和井字棋一样有最优解,但是双方都会像井字棋一样犯错。所以不可能有一方一直最优解,因此一定有一方会获胜。

考虑最优解不能只单纯最优解,因为对方不一定有你想象的聪明。而是要反过来推算对方会怎么做。

当一所新公司进入垄断市场时,垄断企业不一定反击,因为这样做损失是大于收益的。但是有一种情况,对方可能会杀鸡儆猴。

3.24 P16

假设一个垄断市场,有10家公司排着队要进入:

那么,垄断企业此时若为了杀鸡儆猴而杀死这些企业,它肯定不会杀死第十家公司,因为恐吓不到后面的人了(后面没人了)。

同理第九家也是一样的,第八、第七到第一都是。

不过这个理论有个问题,就是第一家进入的永远是第一家,垄断企业也只会杀死第一家。

另一个模型,两个人拿海绵对峙,你可以向前走,或者直接扔到对面脸上。只能扔一次。

可以推断,到某一点,你投中的概览+对方下一步投中的概览>1。此时应该投,否则对方下一步就会投。

但是现实中人们往往会高估自己,而且概率这件事情很难算,更不要说算对方的概率。

3.25 P17

假设有一元钱,你可以选择给对方多少,对方接受,二人拿钱;不接受,二人都没钱。此时不论给多少,都应该接受。

如果是二轮博弈,第二天总额会有折损,那第一天就要开出接收者第二天能拿到的最大值,以防折损使得所有人利益受害。

理性上,无论多少轮博弈,你都可以算出结果,但实际上你不知道每轮折损有多少。

另外,急于用钱或者脾气差都会让你在博弈中处于劣势。

3.26 P18

模型一:未知前提博弈。指甲做决策,乙做决定。但是乙不知道甲选了什么,只能选期望最高的。这样叫一个集合,以虚线表示。另外乙不能以选项倒推自己在决策树哪个位置,所以虚线上下要画成一样。

模型二:子博弈。三人博弈,A选,BC再博弈,BC的就是子博弈。注意子博弈不能卡在虚线中间。

另外,A如果不让BC进入博弈直接立场,这个属于纳什均衡,虽然BC选不了,但是这符合定义。

3.27 P19

一.有时候人们担心对方搞砸,于是就不选最佳平衡策略,而是第一步就退场求保底。

结果对方也这样想,结果都搞砸了。

二.(上一节的模型)Jack撮合David和Nina约会,二人成功率只有4/9,所以Jack期望收益是-1/9,因此他不应该撮合。

三. 投资新设备使得成功率减半,但设备成本10万,这里多了三部分收益,一是减少的成本,二是增产后边际收益增加减少的成本,三是增产迫使竞争者减产带来的额外收益。

3.28 P20

模型:双方可互相攻击,第一轮若A不攻击,B攻击,A得0,B得1;若都不攻,都0;都攻击,各-0.75,进入下一轮。

结论是,如果对方好斗,应该不攻击;对方好投降,应该攻击。不论多少论,结果都一样,只是增加沉没成本。

收益上升,攻击率更高;损失上升,攻率更低。混合策略解决。

3.29 P21

假设一个长期项目,合作可以二人赚钱,背叛可以多赚一点。那最后一局就该背叛,因为没有下一局了。

以此类推,倒数第二局就应该背叛,因为下一局一定背叛。以此类推。

问题在于,提早背叛会减少收益(参考上面10家公司排队进入垄断行业)。防止背叛的最有效手段是提高失信损失和降低背叛收益。

如果是否有下一轮完全随机,且概率很高,那也大概率会合作。

3.30 P22

扣扳机策略:如果你背叛我,我一次也背叛你,这是防止背叛的有效手段。

但有时候太过激了,一点过错就导致合作终止(卖黄瓜的商人问题),所以可以改为暂时终止一回合。

如果有下一轮的概率大于1/3,下一轮就不能欺骗(取决于具体数据)。如果是单回合惩罚,1/2就可以。

关系快终止时,人们会更倾向于欺骗,因为不看未来合作了。

再一个地方,外包请人做项目,你付给他的钱不仅有当地工资,还有你的产品价值,否则他就会卷钱跑路;但如果有很多回合,回合数趋于无穷,报酬就可以接近当地工资。

3.31 P23

非对称信息:如果我成本比你低,那么我公开信息,让你减产,我收益更大;而不公布的人就会被默认成本高。所以这里默认信息是透明的。比如饭店卫生评价为A的就会把A挂在店里,不挂的就默认没A。

MBA学历可以作为区分好坏员工的手段,因为好员工学起MBA简单,成本低,所以总收益高;差员工学习成本高,收益算下来与其读MBA还不如直接去就业。如果MBA太简单,就不会形成这种区分了。考研原理类似。

4.1 P24

未知收益的博弈:
拍卖:未知拍卖(不知他人如何出价),最后赢家往往损失大于收入。然后后悔。所以我们出价需要比预估低。
以上为A 匿名拍卖。

B 出价最高的赢,但只需付第二高出价的人的出价。这样可以促使高价,这个方法赢了诺贝尔奖。

C 价格不断升高,直到只有一个人举手。

D 价格不断降低,直到有人拍下。

D和A其实是一样的,都是不知他人出价的拍卖,而且赢家必吃亏。BC不相关,但很类似。C举手到最后的人会出最高价,即B中第二高价。

这篇关于耶鲁大学《博弈论》公开课笔记的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1127447

相关文章

【学习笔记】 陈强-机器学习-Python-Ch15 人工神经网络(1)sklearn

系列文章目录 监督学习:参数方法 【学习笔记】 陈强-机器学习-Python-Ch4 线性回归 【学习笔记】 陈强-机器学习-Python-Ch5 逻辑回归 【课后题练习】 陈强-机器学习-Python-Ch5 逻辑回归(SAheart.csv) 【学习笔记】 陈强-机器学习-Python-Ch6 多项逻辑回归 【学习笔记 及 课后题练习】 陈强-机器学习-Python-Ch7 判别分析 【学

系统架构师考试学习笔记第三篇——架构设计高级知识(20)通信系统架构设计理论与实践

本章知识考点:         第20课时主要学习通信系统架构设计的理论和工作中的实践。根据新版考试大纲,本课时知识点会涉及案例分析题(25分),而在历年考试中,案例题对该部分内容的考查并不多,虽在综合知识选择题目中经常考查,但分值也不高。本课时内容侧重于对知识点的记忆和理解,按照以往的出题规律,通信系统架构设计基础知识点多来源于教材内的基础网络设备、网络架构和教材外最新时事热点技术。本课时知识

论文阅读笔记: Segment Anything

文章目录 Segment Anything摘要引言任务模型数据引擎数据集负责任的人工智能 Segment Anything Model图像编码器提示编码器mask解码器解决歧义损失和训练 Segment Anything 论文地址: https://arxiv.org/abs/2304.02643 代码地址:https://github.com/facebookresear

数学建模笔记—— 非线性规划

数学建模笔记—— 非线性规划 非线性规划1. 模型原理1.1 非线性规划的标准型1.2 非线性规划求解的Matlab函数 2. 典型例题3. matlab代码求解3.1 例1 一个简单示例3.2 例2 选址问题1. 第一问 线性规划2. 第二问 非线性规划 非线性规划 非线性规划是一种求解目标函数或约束条件中有一个或几个非线性函数的最优化问题的方法。运筹学的一个重要分支。2

【C++学习笔记 20】C++中的智能指针

智能指针的功能 在上一篇笔记提到了在栈和堆上创建变量的区别,使用new关键字创建变量时,需要搭配delete关键字销毁变量。而智能指针的作用就是调用new分配内存时,不必自己去调用delete,甚至不用调用new。 智能指针实际上就是对原始指针的包装。 unique_ptr 最简单的智能指针,是一种作用域指针,意思是当指针超出该作用域时,会自动调用delete。它名为unique的原因是这个

查看提交历史 —— Git 学习笔记 11

查看提交历史 查看提交历史 不带任何选项的git log-p选项--stat 选项--pretty=oneline选项--pretty=format选项git log常用选项列表参考资料 在提交了若干更新,又或者克隆了某个项目之后,你也许想回顾下提交历史。 完成这个任务最简单而又有效的 工具是 git log 命令。 接下来的例子会用一个用于演示的 simplegit

记录每次更新到仓库 —— Git 学习笔记 10

记录每次更新到仓库 文章目录 文件的状态三个区域检查当前文件状态跟踪新文件取消跟踪(un-tracking)文件重新跟踪(re-tracking)文件暂存已修改文件忽略某些文件查看已暂存和未暂存的修改提交更新跳过暂存区删除文件移动文件参考资料 咱们接着很多天以前的 取得Git仓库 这篇文章继续说。 文件的状态 不管是通过哪种方法,现在我们已经有了一个仓库,并从这个仓

忽略某些文件 —— Git 学习笔记 05

忽略某些文件 忽略某些文件 通过.gitignore文件其他规则源如何选择规则源参考资料 对于某些文件,我们不希望把它们纳入 Git 的管理,也不希望它们总出现在未跟踪文件列表。通常它们都是些自动生成的文件,比如日志文件、编译过程中创建的临时文件等。 通过.gitignore文件 假设我们要忽略 lib.a 文件,那我们可以在 lib.a 所在目录下创建一个名为 .gi

取得 Git 仓库 —— Git 学习笔记 04

取得 Git 仓库 —— Git 学习笔记 04 我认为, Git 的学习分为两大块:一是工作区、索引、本地版本库之间的交互;二是本地版本库和远程版本库之间的交互。第一块是基础,第二块是难点。 下面,我们就围绕着第一部分内容来学习,先不考虑远程仓库,只考虑本地仓库。 怎样取得项目的 Git 仓库? 有两种取得 Git 项目仓库的方法。第一种是在本地创建一个新的仓库,第二种是把其他地方的某个

Git 的特点—— Git 学习笔记 02

文章目录 Git 简史Git 的特点直接记录快照,而非差异比较近乎所有操作都是本地执行保证完整性一般只添加数据 参考资料 Git 简史 众所周知,Linux 内核开源项目有着为数众多的参与者。这么多人在世界各地为 Linux 编写代码,那Linux 的代码是如何管理的呢?事实是在 2002 年以前,世界各地的开发者把源代码通过 diff 的方式发给 Linus,然后由 Linus