庙算兵棋推演AI开发初探(3-编写策略(下))

2024-01-02 02:12

本文主要是介绍庙算兵棋推演AI开发初探(3-编写策略(下)),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

这回从解读step函数中的这两句代码开始,返回的action是真正做出的行为

gen_action = self.priority[action_type]
action = gen_action(obj_id, valid_actions[action_type])

追到self.priority 结果是一套定义

        self.priority = {ActionType.Occupy: self.gen_occupy,ActionType.Shoot: self.gen_shoot,ActionType.GuideShoot: self.gen_guide_shoot,ActionType.JMPlan: self.gen_jm_plan,ActionType.LayMine: self.gen_lay_mine,ActionType.ActivateRadar: self.gen_activate_radar,ActionType.ChangeAltitude: self.gen_change_altitude,ActionType.GetOn: self.gen_get_on,ActionType.GetOff: self.gen_get_off,ActionType.Fork: self.gen_fork,ActionType.Union: self.gen_union,ActionType.EnterFort: self.gen_enter_fort,ActionType.ExitFort: self.gen_exit_fort,ActionType.Move: self.gen_move,ActionType.RemoveKeep: self.gen_remove_keep,ActionType.ChangeState: self.gen_change_state,ActionType.StopMove: self.gen_stop_move,ActionType.WeaponLock: self.gen_WeaponLock,ActionType.WeaponUnFold: self.gen_WeaponUnFold,ActionType.CancelJMPlan: self.gen_cancel_JM_plan}  # choose action by priority

仔细看一下,原来是类似于函数指针的写法,将一堆变量指向了一堆函数,然后在代码里定义了诸多的函数。

比如……gen_move函数,就是得到一个路径列表的返回值。

    def gen_move(self, obj_id, candidate):"""Generate move action to a random city."""bop = self.get_bop(obj_id)if bop["sub_type"] == 3:returndestination = random.choice([city["coord"] for city in self.observation["cities"]])if self.my_direction:destination = self.my_direction["info"]["target_pos"]if bop and bop["cur_hex"] != destination:move_type = self.get_move_type(bop)route = self.map.gen_move_route(bop["cur_hex"], destination, move_type)return {"actor": self.seat,"obj_id": obj_id,"type": ActionType.Move,"move_path": route,}
  1. 获取实体的当前位置(bop)。
  2. 如果实体的子类型为3,则直接返回一个空操作,因为该实体无法执行移动操作。
  3. 随机选择一个城市作为目的地。
  4. 如果机器人和目的地之间存在路径,则生成一个移动操作,其中actor表示执行该操作的实体(即self.seat),obj_id表示执行该操作的实体ID,type表示动作类型为ActionType.Movemove_path表示实体的移动路径。

这里map.gen_move_route函数和self.get_move_type函数又引用自其他地方编写的。

——

上一篇已经写了,调用起来就是遍历单位、找到合理的动作,再去使用编写的获取具体哪个动作的函数。

        # loop all bops and their valid actionsfor obj_id, valid_actions in observation["valid_actions"].items():if obj_id not in self.controllable_ops:continuefor (action_type) in self.priority:  # 'dict' is order-preserving since Python 3.6if action_type not in valid_actions:continue# find the action generation method based on typegen_action = self.priority[action_type]action = gen_action(obj_id, valid_actions[action_type])if action:total_actions.append(action)break  # one action per bop at a time# if total_actions:#     print(#         f'{self.color} actions at step: {observation["time"]["cur_step"]}', end='\n\t')#     print(total_actions)return total_actions

就是上面这段,重点是本篇博文开始时提到的那两行。


基本流程至此都看明白了,那么如何编写一个策略呢?

这篇关于庙算兵棋推演AI开发初探(3-编写策略(下))的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/561062

相关文章

PyCharm接入DeepSeek实现AI编程的操作流程

《PyCharm接入DeepSeek实现AI编程的操作流程》DeepSeek是一家专注于人工智能技术研发的公司,致力于开发高性能、低成本的AI模型,接下来,我们把DeepSeek接入到PyCharm中... 目录引言效果演示创建API key在PyCharm中下载Continue插件配置Continue引言

Redis多种内存淘汰策略及配置技巧分享

《Redis多种内存淘汰策略及配置技巧分享》本文介绍了Redis内存满时的淘汰机制,包括内存淘汰机制的概念,Redis提供的8种淘汰策略(如noeviction、volatile-lru等)及其适用场... 目录前言一、什么是 Redis 的内存淘汰机制?二、Redis 内存淘汰策略1. pythonnoe

利用Python编写一个简单的聊天机器人

《利用Python编写一个简单的聊天机器人》这篇文章主要为大家详细介绍了如何利用Python编写一个简单的聊天机器人,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 使用 python 编写一个简单的聊天机器人可以从最基础的逻辑开始,然后逐步加入更复杂的功能。这里我们将先实现一个简单的

基于Python开发电脑定时关机工具

《基于Python开发电脑定时关机工具》这篇文章主要为大家详细介绍了如何基于Python开发一个电脑定时关机工具,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录1. 简介2. 运行效果3. 相关源码1. 简介这个程序就像一个“忠实的管家”,帮你按时关掉电脑,而且全程不需要你多做

Java中的Opencv简介与开发环境部署方法

《Java中的Opencv简介与开发环境部署方法》OpenCV是一个开源的计算机视觉和图像处理库,提供了丰富的图像处理算法和工具,它支持多种图像处理和计算机视觉算法,可以用于物体识别与跟踪、图像分割与... 目录1.Opencv简介Opencv的应用2.Java使用OpenCV进行图像操作opencv安装j

Ubuntu系统怎么安装Warp? 新一代AI 终端神器安装使用方法

《Ubuntu系统怎么安装Warp?新一代AI终端神器安装使用方法》Warp是一款使用Rust开发的现代化AI终端工具,该怎么再Ubuntu系统中安装使用呢?下面我们就来看看详细教程... Warp Terminal 是一款使用 Rust 开发的现代化「AI 终端」工具。最初它只支持 MACOS,但在 20

Python 中 requests 与 aiohttp 在实际项目中的选择策略详解

《Python中requests与aiohttp在实际项目中的选择策略详解》本文主要介绍了Python爬虫开发中常用的两个库requests和aiohttp的使用方法及其区别,通过实际项目案... 目录一、requests 库二、aiohttp 库三、requests 和 aiohttp 的比较四、requ

Redis过期键删除策略解读

《Redis过期键删除策略解读》Redis通过惰性删除策略和定期删除策略来管理过期键,惰性删除策略在键被访问时检查是否过期并删除,节省CPU开销但可能导致过期键滞留,定期删除策略定期扫描并删除过期键,... 目录1.Redis使用两种不同的策略来删除过期键,分别是惰性删除策略和定期删除策略1.1惰性删除策略

使用PyQt5编写一个简单的取色器

《使用PyQt5编写一个简单的取色器》:本文主要介绍PyQt5搭建的一个取色器,一共写了两款应用,一款使用快捷键捕获鼠标附近图像的RGB和16进制颜色编码,一款跟随鼠标刷新图像的RGB和16... 目录取色器1取色器2PyQt5搭建的一个取色器,一共写了两款应用,一款使用快捷键捕获鼠标附近图像的RGB和16

基于Qt开发一个简单的OFD阅读器

《基于Qt开发一个简单的OFD阅读器》这篇文章主要为大家详细介绍了如何使用Qt框架开发一个功能强大且性能优异的OFD阅读器,文中的示例代码讲解详细,有需要的小伙伴可以参考一下... 目录摘要引言一、OFD文件格式解析二、文档结构解析三、页面渲染四、用户交互五、性能优化六、示例代码七、未来发展方向八、结论摘要