博弈论详解 1(基本理论定义 和 Nim 游戏)

2024-08-26 18:20

本文主要是介绍博弈论详解 1(基本理论定义 和 Nim 游戏),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

公平博弈游戏

  1. 一般是两个玩家,轮流操作。
  2. 是否能够必胜只和当前局面相关,不与现在是轮到哪个玩家相关(说白了就是不分黑白棋子,格点也不分黑白,都一样)。
  3. 固定了开始状态后,可能的局面数是有限的。
  4. 游戏一定会在有限步内结束

怎么才能赢?

必胜局面与必败局面

我们定义当前的局面对于先手(指的是要对当前局面进行操作的人,下面对先手的定义也相同)是必胜的为 N N N 局面,必败为 P P P 局面。根据必胜与必败的定义,可知:

  1. 如果当前是 N N N 局面,那么操作者一定能够通过做某一种操作使得局面变成 P P P 局面,使对方(要对 P P P 局面操作的人)必败,自己也就必胜。简单说就是从 N N N 能走到 P P P
  2. 如果当前是 P P P 局面,那么操作者无论如何操作,总是会输,也就是说只能到达 N N N 局面,使对方必胜,自己必败(如果 P P P 能到 P P P,那么意味着操作者可以反败为胜,此局面是 N N N 局面,矛盾)。简单来说就是从 P P P 只能走到 N N N

什么样的局面是必胜的?

假设满足条件 C C C,局面就必胜,否则必败。根据上面的分析,容易发现:

  1. 满足 C C C 的局面一定能走到不满足 C C C 的局面。
  2. 不满足 C C C 的局面只能走到满足 C C C 的局面。

由于游戏结束时的局面是必败的(已经输了),所以再加上一条: 最终局面不满足 C C C
那么该怎么找到条件 C C C 呢?这很困难,一般都是引用先辈的结论。我们举一个简单的例子:Nim 游戏。

Nim游戏

游戏规则

n n n 堆石子,第 i i i 堆石子有 a i a_i ai 个,每次操作可以取走一堆石子中的任意数量的石子。如果轮到一方取石子的时候没有石子了,Ta 就输了。

必胜条件 C

C : a 1 ⊕ a 2 ⊕ a 3 ⊕ . . . ⊕ a n ≠ 0 C:a_1\oplus a_2\oplus a_3\oplus...\oplus a_n\ne0 C:a1a2a3...an=0 a 1 ⊕ a 2 ⊕ a 3 ⊕ . . . ⊕ a n a_1\oplus a_2\oplus a_3\oplus...\oplus a_n a1a2a3...an 也称为 Nim 和)
B u t But But W h y ? Why? Why?
首先,当 a 1 = a 2 = a 3 = . . . = a n = 0 a_1=a_2=a_3=...=a_n=0 a1=a2=a3=...=an=0 的时候,是最终局面,上述等式不成立,所以 C C C 要满足的第三个条件已经得证。
对异或的性质不是很了解的可以看一下本人之前写的一篇文章,主要结论:交换律,结合律和 x ⊕ y = z x\oplus y=z xy=z x ⊕ z = y x\oplus z=y xz=y

第一个条件:假设操作之后的石子数量变成 a 1 ′ , a 2 , a 3 . . . a n a_1',a_2,a_3...a_n a1,a2,a3...an,是 P 局面,则需满足 a 1 ′ ⊕ a 2 ⊕ a 3 ⊕ . . . ⊕ a n = 0 a_1'\oplus a_2\oplus a_3\oplus...\oplus a_n=0 a1a2a3...an=0,要证明 a 1 > a 1 ′ a_1>a_1' a1>a1
A = a 2 ⊕ a 3 ⊕ . . . ⊕ a n A=a_2\oplus a_3\oplus...\oplus a_n A=a2a3...an B = a 1 ⊕ a 2 ⊕ a 3 ⊕ . . . ⊕ a n B=a_1\oplus a_2\oplus a_3\oplus...\oplus a_n B=a1a2a3...an。因为 a 1 ′ ⊕ A = 0 a_1'\oplus A=0 a1A=0,所以 a 1 ′ = A a_1'=A a1=A;因为 a 1 ⊕ A = B a_1\oplus A=B a1A=B,所以 a 1 ′ = A = B ⊕ a 1 a_1'=A=B\oplus a_1 a1=A=Ba1
B B B 的二进制中最高的为 1 1 1 的位置是第 k k k 位(从低位到高位,最低位是第 0 0 0 位),不妨设 a 1 a_1 a1 的二进制中包含 2 k 2^k 2k(这 n n n 个数里必然有一个数包含 2 k 2^k 2k,否则 B B B 的第 k k k 位是 0 0 0)。因为两者的第 k k k 位都是 1 1 1,所以 B ⊕ a 1 B\oplus a_1 Ba1 的第 k k k 位是 0 0 0。但是 B B B 的更高位上没有 1 1 1 了,所以 B ⊕ a 1 < a 1 B\oplus a_1<a_1 Ba1<a1,即 a 1 ′ < a 1 a_1'<a_1 a1<a1,可以通过从 a 1 a_1 a1 中拿走一些石子实现转移。
你竟然看懂了第一个条件的证明!太厉害了,第二个条件会简单很多!

第二个条件:由于此时 Nim 和等于 0 0 0,假设你从第 i i i 堆拿走了 j j j 个石子,此时 Nim 和变为 ( a 1 ⊕ a 2 ⊕ . . . ⊕ a n ) ⊕ a i ⊕ ( a i − j ) (a_1\oplus a_2\oplus...\oplus a_n)\oplus a_i\oplus (a_i-j) (a1a2...an)ai(aij)(就是先把原本的 a i a_i ai 从 Nim 和中去掉,再异或上新的 a i a_i ai)。由于 j > 0 j>0 j>0,所以 a i − j ≠ a i a_i-j\ne a_i aij=ai a i ⊕ ( a i − j ) ≠ 0 a_i\oplus (a_i-j)\ne 0 ai(aij)=0,新的 Nim 和不等于 0 0 0,转移到 N 局面。

必胜操作

必胜操作也已经在第一个条件的证明中提到了,如果你必胜,那么就在 a 1 a_1 a1 中拿走 a 1 − ( a 1 ⊕ Nim和 ) a_1-(a_1\oplus \text{Nim和}) a1(a1Nim) 个石子( a 1 a_1 a1 是一堆石子,满足 a 1 a_1 a1 包含 Nim 和最高位的 1 1 1 所代表的值 2 k 2^k 2k

想继续学习请看后续:博弈论详解 2(SG函数——对于一切公平博弈游戏通用的必胜条件)

题外话

此结论和证明都过于神奇且抽象,如果没看懂可以多研究一下,本人写文章的时候也差点绕进去了。

这篇关于博弈论详解 1(基本理论定义 和 Nim 游戏)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1109329

相关文章

Debezium 与 Apache Kafka 的集成方式步骤详解

《Debezium与ApacheKafka的集成方式步骤详解》本文详细介绍了如何将Debezium与ApacheKafka集成,包括集成概述、步骤、注意事项等,通过KafkaConnect,D... 目录一、集成概述二、集成步骤1. 准备 Kafka 环境2. 配置 Kafka Connect3. 安装 D

Java中ArrayList和LinkedList有什么区别举例详解

《Java中ArrayList和LinkedList有什么区别举例详解》:本文主要介绍Java中ArrayList和LinkedList区别的相关资料,包括数据结构特性、核心操作性能、内存与GC影... 目录一、底层数据结构二、核心操作性能对比三、内存与 GC 影响四、扩容机制五、线程安全与并发方案六、工程

Spring Cloud LoadBalancer 负载均衡详解

《SpringCloudLoadBalancer负载均衡详解》本文介绍了如何在SpringCloud中使用SpringCloudLoadBalancer实现客户端负载均衡,并详细讲解了轮询策略和... 目录1. 在 idea 上运行多个服务2. 问题引入3. 负载均衡4. Spring Cloud Load

Springboot中分析SQL性能的两种方式详解

《Springboot中分析SQL性能的两种方式详解》文章介绍了SQL性能分析的两种方式:MyBatis-Plus性能分析插件和p6spy框架,MyBatis-Plus插件配置简单,适用于开发和测试环... 目录SQL性能分析的两种方式:功能介绍实现方式:实现步骤:SQL性能分析的两种方式:功能介绍记录

在 Spring Boot 中使用 @Autowired和 @Bean注解的示例详解

《在SpringBoot中使用@Autowired和@Bean注解的示例详解》本文通过一个示例演示了如何在SpringBoot中使用@Autowired和@Bean注解进行依赖注入和Bean... 目录在 Spring Boot 中使用 @Autowired 和 @Bean 注解示例背景1. 定义 Stud

如何通过海康威视设备网络SDK进行Java二次开发摄像头车牌识别详解

《如何通过海康威视设备网络SDK进行Java二次开发摄像头车牌识别详解》:本文主要介绍如何通过海康威视设备网络SDK进行Java二次开发摄像头车牌识别的相关资料,描述了如何使用海康威视设备网络SD... 目录前言开发流程问题和解决方案dll库加载不到的问题老旧版本sdk不兼容的问题关键实现流程总结前言作为

SQL 中多表查询的常见连接方式详解

《SQL中多表查询的常见连接方式详解》本文介绍SQL中多表查询的常见连接方式,包括内连接(INNERJOIN)、左连接(LEFTJOIN)、右连接(RIGHTJOIN)、全外连接(FULLOUTER... 目录一、连接类型图表(ASCII 形式)二、前置代码(创建示例表)三、连接方式代码示例1. 内连接(I

Go路由注册方法详解

《Go路由注册方法详解》Go语言中,http.NewServeMux()和http.HandleFunc()是两种不同的路由注册方式,前者创建独立的ServeMux实例,适合模块化和分层路由,灵活性高... 目录Go路由注册方法1. 路由注册的方式2. 路由器的独立性3. 灵活性4. 启动服务器的方式5.

Java中八大包装类举例详解(通俗易懂)

《Java中八大包装类举例详解(通俗易懂)》:本文主要介绍Java中的包装类,包括它们的作用、特点、用途以及如何进行装箱和拆箱,包装类还提供了许多实用方法,如转换、获取基本类型值、比较和类型检测,... 目录一、包装类(Wrapper Class)1、简要介绍2、包装类特点3、包装类用途二、装箱和拆箱1、装

Go语言中三种容器类型的数据结构详解

《Go语言中三种容器类型的数据结构详解》在Go语言中,有三种主要的容器类型用于存储和操作集合数据:本文主要介绍三者的使用与区别,感兴趣的小伙伴可以跟随小编一起学习一下... 目录基本概念1. 数组(Array)2. 切片(Slice)3. 映射(Map)对比总结注意事项基本概念在 Go 语言中,有三种主要