本文主要是介绍人工智能原理第五章课后习题(仅供参考),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
5.1 回顾博弈问题的六种类型,是否还有其它类型的博弈?为什么?
1. 合作与非合作:
合作博弈是指参与者从己方的利益出发与其他参与达成协议或者形成联盟,其结果对各方均有利;
非合作博弈则与其相反,参与者无法形成约束性协议或联盟,因而选择对抗性的行为。(囚徒困境)
2. 零和与非零和
零和博弈指的是参与者各方经过博弈之后,一方的收益必然意味着另一方的损失,或者双方的结果是平局。因此零和博弈中各方的收益和损失之和永远为零。
非零和博弈则指的是博弈后各方的收益小于或大于零,即非零。(囚徒困境,带有合作竞争的关系)
3. 完美与不完美信息
完美信息博弈,指的是在顺序博弈的过程中,每个参与者在做任何决策时都完全了解曾将发生的所有信息,否则称为非完美博弈。(完美:象棋,西洋跳棋等)
4. 对称与非对称
对称博弈指的是每个参与者在博弈中采取与对手相同的策略时能得到同样的收益,即改变参与者的身份而不会改变策略的收益,则该博弈是对称的。
5. 随机与非随机
随机博弈由一个或多个参与者参与的具有概率变迁性质的动态游戏。随机博弈比赛一般分阶段进行。每一阶段开始时,游戏处于某种随机状态。某个博弈者选择动作,其他博弈者们接受一个取决于当前状态和所选动作的回报。然后游戏进入一个新的随机状态,其分布取决于先前的状态和参与者选择的动作。(多人游戏的掷骰子)
6. 同步与顺序
同步博弈指的是每个博弈者在不知道其他博弈者动作的情况下同步自己动作的博弈。(囚徒困境,石头剪刀布)
顺序博弈是由博弈者轮流、交替动作的博弈。(棋盘类游戏、纸牌类游戏)
这篇关于人工智能原理第五章课后习题(仅供参考)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!