强化学习实践(二)Gym(安装、环境搭建、运行倒立摆(代码可运行))

2023-10-06 12:39

本文主要是介绍强化学习实践(二)Gym(安装、环境搭建、运行倒立摆(代码可运行)),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

1.准备工作

      优先选用conda,conda不仅可以安装python,也是环境管理的工具,我们可以通过conda创建python环境,每个环境之间是相互独立,这样不同的环境可以使用不同版本的python,不同版本的开发包,避免了Python版本不同需要来回切换的问题。

      gym目前并不支持python3.11版本,但我最初安装的conda的python是3.11版本,所以更换成3.8 版本:解决

2.安装及测试

2.1虚拟环境

conda create --name Gym python=3.7 # 创建虚拟环境,其中可Gym替换成任何名字,3.7可替换成任何版本conda activate Gym # 激活虚拟环境

2.2安装

1.最小化安装(只包括少量的内置环境,如算法环境、简单文字游戏环境和经典控制环境)

pip install gym
pip install pygame
pip install numpy

强化学习笔记:Gym入门--从安装到第一个完整的代码示例_gym安装-CSDN博客

2.完整安装

pip install --upgrade gym[atari] # 以atari为例,按照类别安装
pip install --upgrade gym[all]   # 全部安装

2.2测试(本代码可运行)

import gym
import time
# 生成环境
env = gym.make('CartPole-v1', render_mode='human') # human指在人类显示器或终端上渲染
# 环境初始化
state = env.reset()
# 循环交互
while True:# 渲染画面env.render()# 从动作空间随机获取一个动作action = env.action_space.sample()# agent与环境进行一步交互state, reward, done, truncated, info = env.step(action)print('动作 = {0}: 当前状态 = {1}, 奖励 = {2}, 结束标志 = {3}, 日志信息 = {4}'.format(action, state, reward, done,info))# 判断当前episode 是否完成if done:print('done')breaktime.sleep(0.1)
# 环境结束
env.close()

代码2:2

3.一些问题

①在电脑终端中无法打开虚拟环境:

解决:activate base  #先打开基础环境
activate pytorch #再打开其他环境,pytorch可替换成你的环境

②最开始可以在pycharm中激活虚拟环境,后进行一番操作后反而不能激活。

解决:最开始看其他博主所言怀疑是未在系统变量中添加conda地址,但添加后依然无用。最后新建项目基于Conda解决,但之间在Virtualenv环境下是可以激活虚拟环境的,问题待解。

注意:Virtualenv环境下设置的是python.exe,Conda环境下是conba.bat,其位置一般在library/bin目录下。

参考文献

1.强化学习笔记:Gym入门--从安装到第一个完整的代码示例_gym安装-CSDN博客

2.强化学习Openai Gym基础环境搭建_强化学习环境-CSDN博客

3.构建自己的gym训练环境 巨详细_gym自定义环境-CSDN博客 

4.python 笔记 :Gym库 (官方文档笔记)_python gym_UQI-LIUWJ的博客-CSDN博客

5.强化学习笔记:多臂老虎机问题(2)--Python仿真_k-armed bandit python code-CSDN博客 

这篇关于强化学习实践(二)Gym(安装、环境搭建、运行倒立摆(代码可运行))的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/153075

相关文章

springboot循环依赖问题案例代码及解决办法

《springboot循环依赖问题案例代码及解决办法》在SpringBoot中,如果两个或多个Bean之间存在循环依赖(即BeanA依赖BeanB,而BeanB又依赖BeanA),会导致Spring的... 目录1. 什么是循环依赖?2. 循环依赖的场景案例3. 解决循环依赖的常见方法方法 1:使用 @La

使用Python实现快速搭建本地HTTP服务器

《使用Python实现快速搭建本地HTTP服务器》:本文主要介绍如何使用Python快速搭建本地HTTP服务器,轻松实现一键HTTP文件共享,同时结合二维码技术,让访问更简单,感兴趣的小伙伴可以了... 目录1. 概述2. 快速搭建 HTTP 文件共享服务2.1 核心思路2.2 代码实现2.3 代码解读3.

使用C#代码在PDF文档中添加、删除和替换图片

《使用C#代码在PDF文档中添加、删除和替换图片》在当今数字化文档处理场景中,动态操作PDF文档中的图像已成为企业级应用开发的核心需求之一,本文将介绍如何在.NET平台使用C#代码在PDF文档中添加、... 目录引言用C#添加图片到PDF文档用C#删除PDF文档中的图片用C#替换PDF文档中的图片引言在当

Linux系统中卸载与安装JDK的详细教程

《Linux系统中卸载与安装JDK的详细教程》本文详细介绍了如何在Linux系统中通过Xshell和Xftp工具连接与传输文件,然后进行JDK的安装与卸载,安装步骤包括连接Linux、传输JDK安装包... 目录1、卸载1.1 linux删除自带的JDK1.2 Linux上卸载自己安装的JDK2、安装2.1

C#使用SQLite进行大数据量高效处理的代码示例

《C#使用SQLite进行大数据量高效处理的代码示例》在软件开发中,高效处理大数据量是一个常见且具有挑战性的任务,SQLite因其零配置、嵌入式、跨平台的特性,成为许多开发者的首选数据库,本文将深入探... 目录前言准备工作数据实体核心技术批量插入:从乌龟到猎豹的蜕变分页查询:加载百万数据异步处理:拒绝界面

MySQL双主搭建+keepalived高可用的实现

《MySQL双主搭建+keepalived高可用的实现》本文主要介绍了MySQL双主搭建+keepalived高可用的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,... 目录一、测试环境准备二、主从搭建1.创建复制用户2.创建复制关系3.开启复制,确认复制是否成功4.同

用js控制视频播放进度基本示例代码

《用js控制视频播放进度基本示例代码》写前端的时候,很多的时候是需要支持要网页视频播放的功能,下面这篇文章主要给大家介绍了关于用js控制视频播放进度的相关资料,文中通过代码介绍的非常详细,需要的朋友可... 目录前言html部分:JavaScript部分:注意:总结前言在javascript中控制视频播放

Spring Boot 配置文件之类型、加载顺序与最佳实践记录

《SpringBoot配置文件之类型、加载顺序与最佳实践记录》SpringBoot的配置文件是灵活且强大的工具,通过合理的配置管理,可以让应用开发和部署更加高效,无论是简单的属性配置,还是复杂... 目录Spring Boot 配置文件详解一、Spring Boot 配置文件类型1.1 applicatio

Linux卸载自带jdk并安装新jdk版本的图文教程

《Linux卸载自带jdk并安装新jdk版本的图文教程》在Linux系统中,有时需要卸载预装的OpenJDK并安装特定版本的JDK,例如JDK1.8,所以本文给大家详细介绍了Linux卸载自带jdk并... 目录Ⅰ、卸载自带jdkⅡ、安装新版jdkⅠ、卸载自带jdk1、输入命令查看旧jdkrpm -qa

Spring Boot 3.4.3 基于 Spring WebFlux 实现 SSE 功能(代码示例)

《SpringBoot3.4.3基于SpringWebFlux实现SSE功能(代码示例)》SpringBoot3.4.3结合SpringWebFlux实现SSE功能,为实时数据推送提供... 目录1. SSE 简介1.1 什么是 SSE?1.2 SSE 的优点1.3 适用场景2. Spring WebFlu