本文主要是介绍DRL应用实战(一)——开发德州扑克RL智能体【附代码】,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
1 pettingzoo德州扑克-无限制版 游戏规则
观测空间:一个54维的向量,每一维取值为0或1,1表示出现,0表示没出现。
索引 | 含义 | 取值 |
---|---|---|
0~12 | 黑桃A~K | [0,1] |
13~25 | 红心A~K | [0,1] |
26~38 | 方块A~K | [0,1] |
39~51 | 梅花A~K | [0,1] |
52 | 玩家1下注的总筹码 | 1~100 |
53 | 玩家2下注的总筹码 | 1~100 |
动作空间:一个6维的向量,每一维取值为0或1,1表示选择该动作。
动作ID | 动作 |
---|---|
0 | Fold / 弃牌 |
1 | Check / 让牌 / 过牌 |
2 | Call / 跟注 |
3 | Raise Half Pot / 加注和奖金池的一半等值的筹码 |
4 |
这篇关于DRL应用实战(一)——开发德州扑克RL智能体【附代码】的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!