本文主要是介绍耶鲁大学《博弈论》公开课笔记,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
关于本文
该文章基于本人于当天白天看完耶鲁大学《博弈论》公开课后,于当晚记录下依然记得的白天所听内容。该文章为汇总,时间为记录一年后。
目录
- 关于本文
- 2023.3.18 P10
- 3.19 P11
- 3.20 P12
- 3.21 P13
- 3.22 P14
- 3.23 P15
- 3.24 P16
- 3.25 P17
- 3.26 P18
- 3.27 P19
- 3.28 P20
- 3.29 P21
- 3.30 P22
- 3.31 P23
- 4.1 P24
2023.3.18 P10
混合策略收益一定不高于等于某一纯策略;
在已有博弈中,两种选择收益一定是一样的,否则平衡会被打破;而至选择一种选择,一方的选择取决于对方收益。
因此提高纳税率只能考提高审纳员工资,提高偷税罚款只能降低审查率。
3.19 P11
生物进化均衡点(EN)是双纳什均衡中某个点。
有某已经形成NE(纳什均衡)的种群,新突变体可能让NE向EN对应的NE移动
3.20 P12
H | D | |
---|---|---|
H | (v+2)/2,(v+c)/2 | v,0 |
D | 0,v | v/2,v/2 |
若v>c,则最后只剩下H;若v=c,H收益仍大于D’D’=v/2,故还是只有H;
若c>v,设 H对P 与 D对P 收益相关,则
H: P(v-c)/2+(1-p)v/2 设H=P -> P=v/c;
D: Px0+(1-p)v/2 其为混合NE;
发生争斗的可能性为(v/c)^2 , D的收益是 (1-v/c)(v/2) ,当C上升,收益增加,H结果一样
3.21 P13
按后序分析法,投资1元或者3元或者卷款跑路:
第一个人只能投1元,否则第二个人必卷款跑路;
即使调整收益(让利给第二人),第二人也会用3个1元代替3元来求得更高汇报。
然后是诺曼VS撒克逊战争:
诺曼选择烧船或不烧船,不烧,撒克逊也可选战斗或者逃跑,此时诺曼人也可选战斗或逃跑,最后可以得到撒克逊一定防守,因为跑了的话对方收益更高。
或者诺曼人烧船,此时进入破釜沉舟阶段。
抵押贷款的目的不在于对方真的想要拿到你的赔偿,而是增大你的失信成本,让对方更有底气借款。
3.22 P14
在两家对抗的生产博弈中,一家提高产量,另一家就不得不减少产量,因为市场不变,继续生产就会导致利润下降(如果都继续增产,就会进入价格战)
所以在这一模型里,先下手为强。
如果乙往甲里面安排间谍,其不会受益,因为这样会让自己被动。所以信息不是越多越好,先下手也可能更好。
但不是任何时候,比如石头剪刀布,先下手就不好。
3.23 P15
国际象棋和井字棋一样有最优解,但是双方都会像井字棋一样犯错。所以不可能有一方一直最优解,因此一定有一方会获胜。
考虑最优解不能只单纯最优解,因为对方不一定有你想象的聪明。而是要反过来推算对方会怎么做。
当一所新公司进入垄断市场时,垄断企业不一定反击,因为这样做损失是大于收益的。但是有一种情况,对方可能会杀鸡儆猴。
3.24 P16
假设一个垄断市场,有10家公司排着队要进入:
那么,垄断企业此时若为了杀鸡儆猴而杀死这些企业,它肯定不会杀死第十家公司,因为恐吓不到后面的人了(后面没人了)。
同理第九家也是一样的,第八、第七到第一都是。
不过这个理论有个问题,就是第一家进入的永远是第一家,垄断企业也只会杀死第一家。
另一个模型,两个人拿海绵对峙,你可以向前走,或者直接扔到对面脸上。只能扔一次。
可以推断,到某一点,你投中的概览+对方下一步投中的概览>1。此时应该投,否则对方下一步就会投。
但是现实中人们往往会高估自己,而且概率这件事情很难算,更不要说算对方的概率。
3.25 P17
假设有一元钱,你可以选择给对方多少,对方接受,二人拿钱;不接受,二人都没钱。此时不论给多少,都应该接受。
如果是二轮博弈,第二天总额会有折损,那第一天就要开出接收者第二天能拿到的最大值,以防折损使得所有人利益受害。
理性上,无论多少轮博弈,你都可以算出结果,但实际上你不知道每轮折损有多少。
另外,急于用钱或者脾气差都会让你在博弈中处于劣势。
3.26 P18
模型一:未知前提博弈。指甲做决策,乙做决定。但是乙不知道甲选了什么,只能选期望最高的。这样叫一个集合,以虚线表示。另外乙不能以选项倒推自己在决策树哪个位置,所以虚线上下要画成一样。
模型二:子博弈。三人博弈,A选,BC再博弈,BC的就是子博弈。注意子博弈不能卡在虚线中间。
另外,A如果不让BC进入博弈直接立场,这个属于纳什均衡,虽然BC选不了,但是这符合定义。
3.27 P19
一.有时候人们担心对方搞砸,于是就不选最佳平衡策略,而是第一步就退场求保底。
结果对方也这样想,结果都搞砸了。
二.(上一节的模型)Jack撮合David和Nina约会,二人成功率只有4/9,所以Jack期望收益是-1/9,因此他不应该撮合。
三. 投资新设备使得成功率减半,但设备成本10万,这里多了三部分收益,一是减少的成本,二是增产后边际收益增加减少的成本,三是增产迫使竞争者减产带来的额外收益。
3.28 P20
模型:双方可互相攻击,第一轮若A不攻击,B攻击,A得0,B得1;若都不攻,都0;都攻击,各-0.75,进入下一轮。
结论是,如果对方好斗,应该不攻击;对方好投降,应该攻击。不论多少论,结果都一样,只是增加沉没成本。
收益上升,攻击率更高;损失上升,攻率更低。混合策略解决。
3.29 P21
假设一个长期项目,合作可以二人赚钱,背叛可以多赚一点。那最后一局就该背叛,因为没有下一局了。
以此类推,倒数第二局就应该背叛,因为下一局一定背叛。以此类推。
问题在于,提早背叛会减少收益(参考上面10家公司排队进入垄断行业)。防止背叛的最有效手段是提高失信损失和降低背叛收益。
如果是否有下一轮完全随机,且概率很高,那也大概率会合作。
3.30 P22
扣扳机策略:如果你背叛我,我一次也背叛你,这是防止背叛的有效手段。
但有时候太过激了,一点过错就导致合作终止(卖黄瓜的商人问题),所以可以改为暂时终止一回合。
如果有下一轮的概率大于1/3,下一轮就不能欺骗(取决于具体数据)。如果是单回合惩罚,1/2就可以。
关系快终止时,人们会更倾向于欺骗,因为不看未来合作了。
再一个地方,外包请人做项目,你付给他的钱不仅有当地工资,还有你的产品价值,否则他就会卷钱跑路;但如果有很多回合,回合数趋于无穷,报酬就可以接近当地工资。
3.31 P23
非对称信息:如果我成本比你低,那么我公开信息,让你减产,我收益更大;而不公布的人就会被默认成本高。所以这里默认信息是透明的。比如饭店卫生评价为A的就会把A挂在店里,不挂的就默认没A。
MBA学历可以作为区分好坏员工的手段,因为好员工学起MBA简单,成本低,所以总收益高;差员工学习成本高,收益算下来与其读MBA还不如直接去就业。如果MBA太简单,就不会形成这种区分了。考研原理类似。
4.1 P24
未知收益的博弈:
拍卖:未知拍卖(不知他人如何出价),最后赢家往往损失大于收入。然后后悔。所以我们出价需要比预估低。
以上为A 匿名拍卖。
B 出价最高的赢,但只需付第二高出价的人的出价。这样可以促使高价,这个方法赢了诺贝尔奖。
C 价格不断升高,直到只有一个人举手。
D 价格不断降低,直到有人拍下。
D和A其实是一样的,都是不知他人出价的拍卖,而且赢家必吃亏。BC不相关,但很类似。C举手到最后的人会出最高价,即B中第二高价。
这篇关于耶鲁大学《博弈论》公开课笔记的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!