专业学习|博弈论-课程沿革

2024-06-11 22:04

本文主要是介绍专业学习|博弈论-课程沿革,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

学习来源:北京大学刘霖《博弈论》MOOC公开课
备注:仅做学习分享,请勿转载,转载必究!

(一)博弈论的预备知识

        基本的微积分的知识和概率论的知识。简单的说会求导数,会求简单的积分,知道概率分布的含义、几种简单的概率分布,会求数学期望,了解贝叶斯法则。

        博弈论本身的思维方式跟常规的思维方式不一样,要求你具有比较好的逻辑思维能力,以及基本的这个数学知识。内含思维方式:一种的话多层嵌套的换位思考

        导论课主要讲四个方面的内容。第一是课程沿革、第二是博弈论的概述、第三是关于效用理论,它是决策论和博弈论的基础。第四点是如何来表述博弈,因为表述一个博弈是我们分析一个博弈的前提。

        你即使可以协商,要是有一方背叛协议,你毫无办法。这样的博弈,我们称之为叫非合作博弈。就是说即使可以达成协议,这个协议顶多只是君子协议,没有约束力。这样的博弈我们称之为是非合作博弈。

        内卷的本质就是囚徒困境,每个参与者从自己的利益出发,做了理性的选择。

(二)辛普森悖论:性别与药物疗效的复杂关系

        讨论了一个被称为辛普森悖论的现象,其中同一数据集可以从不同角度解释出看似矛盾的结果。特别关注了性别和药物对心脏病患者的影响,指出统计数据的处理方式—分别或汇总分析—取决于问题本身的性质和背景。此外,提出了一个假设药物(BBD药物),对男性和女性都有害,但在不知性别的情况下却有益于所有人的例子,进一步说明了这一悖论的复杂性和对数据分析方法的重要性。

        可是如果进来一个病人,这个病人比方说是一个外国人从他的穿的服装完全不能判断他是男还是女,语言又不通。但是他只是捂着胸口说他的心脏不舒服,这种情况下的话,那怎么办呢?就是说我不知道他的性别的情况下,我再看一下这个表会发现这种情况下吃药比较好在不知道性别的情况下吃药比较好,但是一旦知道性别这个药就不能吃。所以这个药称之为BBD药物,对男人有害,对女人有害,可是对不知道性别的男女是有益的。这个是一个非常著名的一个悖论,叫做辛普森悖论。上个世纪50年代美国的一个统计学家发表了一篇文章提出来的。

        在分析数据的时候,要是对数据能够进行分组比较,得到的说服力是更强的。对总体汇总的数据的话,有可能会给出错误的结论。但如果你得到这样一个结论本身的话,这个结论是错误的。到底应当看分组的数据,还是应当看汇总的数据,没有一定之规,取决于这个问题背后的这些因素之间的逻辑关系

        对于第二张表,应当基于汇总数据来分析,而基于分组数据是错误的。对于前一张表,应当基于分组数据来分析,对于汇总数据的分析是错误的,这个也可以严格的数学证明。当然这涉及到的话。但是我是说讲到这儿的话是说我们的很多问题,你会发现他看起来非常像互相存在关联性。

(三) 博弈论与政策科学:从本科到通选课的演进及应用

(四)博弈论精选教材及其深度解析

        本次课程介绍了一系列博弈论相关教材,并详细分析了它们的特点及适用范围。首先提到的基本教材《博弈论和信息医学》由张文英老师编写,是作者初次学习博弈论时使用的教材。接着介绍了其他几本经典的博弈论教材,包括面向经济学学生的《博弈入门》、《博弈论基础》以及《矛盾冲突分析》,并特别强调了迈尔森的《博弈论矛盾冲突分析》作为目前世界上最好的博弈论教材之一。该书以其深入的思考、严密的逻辑和卓越的翻译质量被广泛认可。此外,文中还提到了该书两名优秀的译者——语音和费建平,他们的协作使得中文版的质量得到了保证。

        这边是几篇与博弈的有关的发表的英文文章。左边是今年8月份刚刚出版的一本书,叫《威慑胁迫与谈判,基于博弈论的研究》

        对我还另外推荐了基本的经典教程。第二本这是叫博弈入门,这是马丁.奥斯本写的。第三本的话是博弈论基础。第四个是迈尔森写的博弈论矛盾冲突分析。后面的三本书都是世界上的有关博弈论的经典教程。

        三本书的差异:中间的那一本主要是写给经济学的学生或者经济学者的,所以他举的例子的话都是有关的话企业竞争产业组织方面的例子,所以比较适合经济学的同学。博弈入门这一本书的话,它的好处是他覆盖的面比较广,而且他举的例子涵盖政治经济、法律生活各个方面的例子,同时的话讲述也非常严谨。但是我最推崇的一本书,是最右边的矛盾冲突分析。这本书它是整个是用的话集合论的符号和语言来写的,所以讲的非常简练,非常准确。这是对强调逻辑,强调严谨的同学来说的话,最好的一本教程。

(五)博弈论:一种广泛应用于社会科学与技术领域的思维与方法

        博弈论不仅仅是一种理论工具,更是一种深入理解和分析社会及科技问题的思维方式。通过本课程的学习,学生将被引导打破传统思维模式,培养深层的、换位思考的博弈思维能力。课程不仅系统讲解博弈论的基本思想和方法,还将介绍其在生物学、计算机科学、军事等多个领域的应用实例。

        学了这个课之后,一个方面能够帮助你打破传统的思维定式,培养这种高阶复杂的博弈思维。层层嵌套的换位思考。第二掌握博弈论的核心的思想和方法。这样不仅有助于你理解很多复杂的社会现象,而且有助于你在你自己的专业领域来采用博弈论的思想方法来分析你们专业领域的特定的问题。

(六)博弈论学习指导:抓住核心,理解理性与策略

        在博弈论的学习过程中,重要的是把握住以球均衡为中心的核心,并理解两个基本点:理性和策略。理性的概念指的是每个参与者在博弈开始前制定的完备行动计划,而策略则是这些计划之间的相互作用和反应。通过理解和应用这两个基本点,可以有效地解决许多实际问题并深入理解博弈论的本质。

        那么作为博弈论的初学者,如何才能够迅速的掌握博弈的思维方式,以及他的理解他的这个思想,理解他的方法。要牢牢的把握一个中心,两个基本点。一个中心是以求均衡为中心,两个基本点。第一个基本点是要理解何为理性。第二个基本点要理解什么是策略

        但是博弈论中的均衡:定义为每一个参与者的一个特定策略构成的组合,要求这个组合满足一定的条件。最简单的定义的话就是纳什均衡,要求所有参与者的策略互为之有反应。

        那么什么是策略呢?其实也很简单,策略是每一个参与者在博弈开始之前制定的一个完备行动计划。不管这个博弈本身多复杂,他事前制定的完备行动计划。什么样的策略组合能够构成一个稳定状态,这是博弈论所分析的中心任务。

(七)博弈论与智谋故事:理性共识与信息不对称

        博弈论与传统的智谋故事存在显著区别。传统故事如空城计虽展现了高度的智慧和策略,但在理论上假设单一行动及其结果的不可重复性。而博弈论基于理性参与者之间的互动,其分析结果强调均衡性和可重复性,避免个体因错误而失败。此外,博弈论着重于信息对策略选择和结果的影响,揭示即便极小的信息差异也可能引起截然不同的结果。课程将主要探讨非合作博弈论,区分其与合作博弈论的主要区别在于后者假定了协议的约束力,强调共同利益下的合作可能性。

        就是理性的假定。我们假定所有参与者都是理性的,不仅如此还具有理性共识。就是说不仅每个人是理性的,而且你的对手是理性的,你也知道你的对手知道你是理性的。换一句话说,没有任何人会以为其中有傻子。那么基于这样的假定出发,我们来分析,相当于每个参与者的话都是比诸葛亮还聪明的人。大家知己知彼是不是?这种情况的话,我们来分析这个问题的均衡是什么。

        理性共识的认定不一样。我们回头会定义理性共识,或者共同知识的层次会具体来定义的。我会发现共同知识的城市不一样,参与者的策略选择可能会不一样,博弈的均衡结果也可能会不一样。所以信息以及信息结构很有可能会使得这个博弈的结果发生翻天覆地的变化。即使表面上看起来信息只有一丁点细微的差异,都有可能导致非常大的不同。所以在博弈中的话,这个信息问题是一个非常重要的一个问题。我们这一门课因为只有一个学期,我们这门课集中精力讲非合作博弈论,就是我打了一个非合作博弈论

(八)博弈论在解决集体问题中的应用

        讨论了利用博弈论原理解决集体问题的可能性与挑战,包括非合作博弈中的协议达成及演化博弈论的应用。强调了重复博弈和理性假定对策略选择的影响,并提出了演化稳定状态的概念。

        非合作博弈论跟合作博弈论的差异在于,在非合作博弈当中,即使所有的参与者为了他们的共同利益,他们愿意签署一个协议,这个协议只是口头的君子协议,没有约束力,有任何一方违背协议,对方无可奈何,这叫非合作博弈。

        另外一类叫合作博弈,就是如果双方要签订了一个协议,这个协议是有法律效力的。要是有人违背协议,另一方可以找到第三方的话,来惩罚他。惩罚的这个成本非常高,足以使对方发现违背协议得不偿失。这种情况下,只要任何一方,只要所有的参与者的话签了一个协议,那么这个协议就对所有的参与者有约束力,这就是合作博弈。合作博弈跟非合作博弈的这一点,对协议的强制力的假定不同,导致这两类博弈问题完全不同。

        博弈的规则不一样,策略选择均衡的结果也可能会不一样。后面还有两类,一类叫演化博弈论,一类叫行为博弈论。

        演化博弈论他是放弃了理性的假定,放弃了参与者是理性的这样一个假定。然后假定所有参与者,比方说像新冠病毒、细菌或者植物或者动物,他们不会选择自己的策略,但是他们通过遗传变异的机制,每一代从自己的父辈那个地方遗传他的这个行为模式,生存竞争,优势劣汰,适应度更好的这样的个体能够存活下来,繁殖更多的后代。因为它能有拥有更多的资源,更多的繁殖的机会,所以它就能够繁殖更多同类的个体。那些竞争中落了下风的个体就会被淘汰,慢慢的被淘汰。经过这样反复的一轮一轮的这种生存竞争演化,最后能不能达到一个稳定状态?这是演化博弈要他的分析的方法。

        演化博弈论的话,你看跟我们讲的经典博弈论(就是基于理性的假定出发来进行分析),这两者之间的话假定完全不一样。但是他们的最后达到的结果的话就惊人的相似。演化稳定的状态一定是基于履行假定的均衡状态而显示的话,是比一般的纳税均衡更强的均衡,更严格的均衡。

(九)行为博弈论及其在经济学中的应用

        行为博弈论关注现实中人在特定博弈问题中的行为选择,并通过这些选择推断其思维过程,以与基于理性模型的预测进行对比。该领域隶属于行为经济学,着重于个体决策问题与博弈情景的应用。教学方法采用启发式和互动式,结合实际案例及实验,旨在深化学生对博弈论的理解和应用能力。

        还有一类叫行为博弈论,行为博弈是什么意思呢?就是说我们是观察现实生活中的人,他们在一个具体的博弈问题中。比方说博弈有可能是生活中的博弈,有可能是我们在实验室里面特地组织的一次博弈,我们来观察现实之中的人,他们在这个博弈中他们的行为选择。但是我们希望通过对现实生活中人们的行为选择,人们在博弈中的行为选择的话,希望能够提炼出一些共同的规律出来。这叫这是行为博弈论。

        行为博弈论本身的话属于行为经济学的一个分支。行为经济学一般的话它是讲的是一个单人决策问题。涉及到博弈问题的话就是行为博弈论。当然在我们这个课上,如果后面我们安排某些博弈实验的时候,相当于就是行为博弈。

(十)教学资源

这篇关于专业学习|博弈论-课程沿革的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1052386

相关文章

HarmonyOS学习(七)——UI(五)常用布局总结

自适应布局 1.1、线性布局(LinearLayout) 通过线性容器Row和Column实现线性布局。Column容器内的子组件按照垂直方向排列,Row组件中的子组件按照水平方向排列。 属性说明space通过space参数设置主轴上子组件的间距,达到各子组件在排列上的等间距效果alignItems设置子组件在交叉轴上的对齐方式,且在各类尺寸屏幕上表现一致,其中交叉轴为垂直时,取值为Vert

Ilya-AI分享的他在OpenAI学习到的15个提示工程技巧

Ilya(不是本人,claude AI)在社交媒体上分享了他在OpenAI学习到的15个Prompt撰写技巧。 以下是详细的内容: 提示精确化:在编写提示时,力求表达清晰准确。清楚地阐述任务需求和概念定义至关重要。例:不用"分析文本",而用"判断这段话的情感倾向:积极、消极还是中性"。 快速迭代:善于快速连续调整提示。熟练的提示工程师能够灵活地进行多轮优化。例:从"总结文章"到"用

【前端学习】AntV G6-08 深入图形与图形分组、自定义节点、节点动画(下)

【课程链接】 AntV G6:深入图形与图形分组、自定义节点、节点动画(下)_哔哩哔哩_bilibili 本章十吾老师讲解了一个复杂的自定义节点中,应该怎样去计算和绘制图形,如何给一个图形制作不间断的动画,以及在鼠标事件之后产生动画。(有点难,需要好好理解) <!DOCTYPE html><html><head><meta charset="UTF-8"><title>06

学习hash总结

2014/1/29/   最近刚开始学hash,名字很陌生,但是hash的思想却很熟悉,以前早就做过此类的题,但是不知道这就是hash思想而已,说白了hash就是一个映射,往往灵活利用数组的下标来实现算法,hash的作用:1、判重;2、统计次数;

零基础学习Redis(10) -- zset类型命令使用

zset是有序集合,内部除了存储元素外,还会存储一个score,存储在zset中的元素会按照score的大小升序排列,不同元素的score可以重复,score相同的元素会按照元素的字典序排列。 1. zset常用命令 1.1 zadd  zadd key [NX | XX] [GT | LT]   [CH] [INCR] score member [score member ...]

【机器学习】高斯过程的基本概念和应用领域以及在python中的实例

引言 高斯过程(Gaussian Process,简称GP)是一种概率模型,用于描述一组随机变量的联合概率分布,其中任何一个有限维度的子集都具有高斯分布 文章目录 引言一、高斯过程1.1 基本定义1.1.1 随机过程1.1.2 高斯分布 1.2 高斯过程的特性1.2.1 联合高斯性1.2.2 均值函数1.2.3 协方差函数(或核函数) 1.3 核函数1.4 高斯过程回归(Gauss

【学习笔记】 陈强-机器学习-Python-Ch15 人工神经网络(1)sklearn

系列文章目录 监督学习:参数方法 【学习笔记】 陈强-机器学习-Python-Ch4 线性回归 【学习笔记】 陈强-机器学习-Python-Ch5 逻辑回归 【课后题练习】 陈强-机器学习-Python-Ch5 逻辑回归(SAheart.csv) 【学习笔记】 陈强-机器学习-Python-Ch6 多项逻辑回归 【学习笔记 及 课后题练习】 陈强-机器学习-Python-Ch7 判别分析 【学

系统架构师考试学习笔记第三篇——架构设计高级知识(20)通信系统架构设计理论与实践

本章知识考点:         第20课时主要学习通信系统架构设计的理论和工作中的实践。根据新版考试大纲,本课时知识点会涉及案例分析题(25分),而在历年考试中,案例题对该部分内容的考查并不多,虽在综合知识选择题目中经常考查,但分值也不高。本课时内容侧重于对知识点的记忆和理解,按照以往的出题规律,通信系统架构设计基础知识点多来源于教材内的基础网络设备、网络架构和教材外最新时事热点技术。本课时知识

线性代数|机器学习-P36在图中找聚类

文章目录 1. 常见图结构2. 谱聚类 感觉后面几节课的内容跨越太大,需要补充太多的知识点,教授讲得内容跨越较大,一般一节课的内容是书本上的一章节内容,所以看视频比较吃力,需要先预习课本内容后才能够很好的理解教授讲解的知识点。 1. 常见图结构 假设我们有如下图结构: Adjacency Matrix:行和列表示的是节点的位置,A[i,j]表示的第 i 个节点和第 j 个

Node.js学习记录(二)

目录 一、express 1、初识express 2、安装express 3、创建并启动web服务器 4、监听 GET&POST 请求、响应内容给客户端 5、获取URL中携带的查询参数 6、获取URL中动态参数 7、静态资源托管 二、工具nodemon 三、express路由 1、express中路由 2、路由的匹配 3、路由模块化 4、路由模块添加前缀 四、中间件