gym atari 游戏安装和使用

2023-11-02 09:40
文章标签 安装 使用 游戏 gym atari

本文主要是介绍gym atari 游戏安装和使用,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

原文链接: gym atari 游戏安装和使用

上一篇: 使用 tkinter 监听键盘和鼠标事件

下一篇: opencv HITMISS 基本操作

github

https://github.com/openai/gym

安装

pip install gym
pip install --no-index -f https://github.com/Kojoley/atari-py/releases atari_py

测试是否成功

import gym
import time'''
pip install gym
pip install --no-index -f https://github.com/Kojoley/atari-py/releases atari_py
'''
# env = gym.make('Pong-v0')
env = gym.make('SpaceInvaders-ram-v4')
# env = gym.make('Breakout-v4')for i_episode in range(1):env.reset()while True:env.render()action = env.action_space.sample()observation, reward, done, info = env.step(action)if done:print("Episode finished")breaktime.sleep(.1)
# 避免结束报错
env.close()

打砖块游戏

返回的observation 是一个 h,w,c 的uint8 数组 表示一幅游戏画面

0 等待

1 发射 小球 (如果没有的话,有的话什么都不做)

2 右

3 左

import gym
import time
env = gym.make('Breakout-v4')
# Discrete(4) set{0, 1, 2, 3}
print(env.action_space)
# Box(210, 160, 3)
print(env.observation_space)for i_episode in range(1):env.reset()while True:env.render()action = env.action_space.sample()observation, reward, done, info = env.step(action)if done:print("Episode finished")breaktime.sleep(.05)
# 避免结束报错
env.close()

3b632556260412cebb53922f5dc6b03bdd7.jpg

随机动作采样,符合均匀分布

import gym
from collections import Counter
env = gym.make('Breakout-v4')a = []
for i_episode in range(1000):env.reset()action = env.action_space.sample()observation, reward, done, info = env.step(action)a.append(action)if done:env.reset()print(Counter(a))Counter({0: 255, 1: 253, 3: 251, 2: 241})

手动玩, 标准动作

ACTION_MEANING = {0 : "NOOP",1 : "FIRE",2 : "UP",3 : "RIGHT",4 : "LEFT",5 : "DOWN",6 : "UPRIGHT",7 : "UPLEFT",8 : "DOWNRIGHT",9 : "DOWNLEFT",10 : "UPFIRE",11 : "RIGHTFIRE",12 : "LEFTFIRE",13 : "DOWNFIRE",14 : "UPRIGHTFIRE",15 : "UPLEFTFIRE",16 : "DOWNRIGHTFIRE",17 : "DOWNLEFTFIRE",
}


通过线程 实现控制,但是不是很流畅

import gym
import time
from threading import Threadclass Game(Thread):def __init__(self):super(Game, self).__init__()self.env = gym.make('Breakout-v4')self.env.reset()self.action = 0def run(self):while True:self.env.render()observation, reward, done, info = self.env.step(self.action)if done:print("Episode finished")breaktime.sleep(.2)g = Game()
g.start()
print('start')while True:s = input('action:\n')if s != '':print(s, int(s))g.action = int(s)

使用多线程

一个线程渲染游戏画面,主线程获取键盘事件并控制游戏中的动作

注意执行动作返回的reward 是该次动作的奖励,只有该动作打到砖块后才会返回正值,全局奖励需要进行求和

import gym
import time
from threading import Thread
from tkinter import *class Game(Thread):def __init__(self):super(Game, self).__init__()self.env = gym.make('Breakout-v4')self.env.reset()self.action = 0self.total_reward = 0def run(self):while True:self.env.render()observation, reward, done, info = self.env.step(self.action)self.total_reward += rewardif done:print("Episode finished")print(self.total_reward)breaktime.sleep(.05)g = Game()
g.start()
print('start')root = Tk()def key(event):# print(event.char)key_map = {'w': 1,  # 发射's': 0,  # 停止'a': 3,  # 左'd': 2  # 右}if event.char != '':g.action = key_map[event.char]print(f'reword:{g.total_reward}')frame = Frame(root, width=100, height=100)
frame.focus_set()
frame.bind("<Key>", key)
frame.pack()
root.mainloop()

这篇关于gym atari 游戏安装和使用的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/329732

相关文章

Android kotlin中 Channel 和 Flow 的区别和选择使用场景分析

《Androidkotlin中Channel和Flow的区别和选择使用场景分析》Kotlin协程中,Flow是冷数据流,按需触发,适合响应式数据处理;Channel是热数据流,持续发送,支持... 目录一、基本概念界定FlowChannel二、核心特性对比数据生产触发条件生产与消费的关系背压处理机制生命周期

java使用protobuf-maven-plugin的插件编译proto文件详解

《java使用protobuf-maven-plugin的插件编译proto文件详解》:本文主要介绍java使用protobuf-maven-plugin的插件编译proto文件,具有很好的参考价... 目录protobuf文件作为数据传输和存储的协议主要介绍在Java使用maven编译proto文件的插件

SpringBoot线程池配置使用示例详解

《SpringBoot线程池配置使用示例详解》SpringBoot集成@Async注解,支持线程池参数配置(核心数、队列容量、拒绝策略等)及生命周期管理,结合监控与任务装饰器,提升异步处理效率与系统... 目录一、核心特性二、添加依赖三、参数详解四、配置线程池五、应用实践代码说明拒绝策略(Rejected

C++ Log4cpp跨平台日志库的使用小结

《C++Log4cpp跨平台日志库的使用小结》Log4cpp是c++类库,本文详细介绍了C++日志库log4cpp的使用方法,及设置日志输出格式和优先级,具有一定的参考价值,感兴趣的可以了解一下... 目录一、介绍1. log4cpp的日志方式2.设置日志输出的格式3. 设置日志的输出优先级二、Window

Ubuntu如何分配​​未使用的空间

《Ubuntu如何分配​​未使用的空间》Ubuntu磁盘空间不足,实际未分配空间8.2G因LVM卷组名称格式差异(双破折号误写)导致无法扩展,确认正确卷组名后,使用lvextend和resize2fs... 目录1:原因2:操作3:报错5:解决问题:确认卷组名称​6:再次操作7:验证扩展是否成功8:问题已解

Qt使用QSqlDatabase连接MySQL实现增删改查功能

《Qt使用QSqlDatabase连接MySQL实现增删改查功能》这篇文章主要为大家详细介绍了Qt如何使用QSqlDatabase连接MySQL实现增删改查功能,文中的示例代码讲解详细,感兴趣的小伙伴... 目录一、创建数据表二、连接mysql数据库三、封装成一个完整的轻量级 ORM 风格类3.1 表结构

使用Docker构建Python Flask程序的详细教程

《使用Docker构建PythonFlask程序的详细教程》在当今的软件开发领域,容器化技术正变得越来越流行,而Docker无疑是其中的佼佼者,本文我们就来聊聊如何使用Docker构建一个简单的Py... 目录引言一、准备工作二、创建 Flask 应用程序三、创建 dockerfile四、构建 Docker

Python使用vllm处理多模态数据的预处理技巧

《Python使用vllm处理多模态数据的预处理技巧》本文深入探讨了在Python环境下使用vLLM处理多模态数据的预处理技巧,我们将从基础概念出发,详细讲解文本、图像、音频等多模态数据的预处理方法,... 目录1. 背景介绍1.1 目的和范围1.2 预期读者1.3 文档结构概述1.4 术语表1.4.1 核

Python使用pip工具实现包自动更新的多种方法

《Python使用pip工具实现包自动更新的多种方法》本文深入探讨了使用Python的pip工具实现包自动更新的各种方法和技术,我们将从基础概念开始,逐步介绍手动更新方法、自动化脚本编写、结合CI/C... 目录1. 背景介绍1.1 目的和范围1.2 预期读者1.3 文档结构概述1.4 术语表1.4.1 核

Conda与Python venv虚拟环境的区别与使用方法详解

《Conda与Pythonvenv虚拟环境的区别与使用方法详解》随着Python社区的成长,虚拟环境的概念和技术也在不断发展,:本文主要介绍Conda与Pythonvenv虚拟环境的区别与使用... 目录前言一、Conda 与 python venv 的核心区别1. Conda 的特点2. Python v