rl-policies-attacks 代码 Debug 记录

2023-10-10 06:30

本文主要是介绍rl-policies-attacks 代码 Debug 记录,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

Dependencies(探索出可行的版本)

cuda==11.0

pytorch==1.7.0

torchvision==0.8.0

torchaudio==0.7.0

cudatoolkit=11.0

python==3.8.13

advertorch==0.2.3

tianshou==0.3.1

atari-py==0.2.9

gym==0.18.0

(atari-py需要导入Rom)

1、环境配置BUG

项目地址:https://github.com/davide97l/rl-policies-attacks-defenses。GitHub没有写环境版本,项目GitHub的issues里有人问环境版本,但是作者没有回答。


用xshell连接Ubuntu服务器,安装了Anaconda3,配置CUDA环境变量,安装Pytorch,配置jupyter notebook。xftp修改代码不方便,于是找了教程用vscode连接实验室的服务器。连好服务器后,在jupyter notebook中运行代码。


error:cannot import name ‘zero_gradients’ from ‘torch.autograd.gradcheck’ ,网上说是旧版的pytorch有这个函数,但是新版pytorch没有,可以在新版中添加这个函数,但是添加了也太行,那就更换pytorch的版本。


尝试在base环境中更换pytorch版本为1.7.0,然后:

error:failed with initial frozen solve. Retrying with flexible solve.

https://blog.csdn.net/weixin_38419133/article/details/115863940

所以新建了一个conda虚拟环境,在新虚拟环境中先把cuda环境变量改成了10.1,然后装了pytorch1.7.0


conda切换虚拟环境之后:

error:Command ‘jupyter’ not found, but can be installed with:

安装nb_conda后能打开jupyter notebook


pip安装了requirements(默认安装的都是最新版的):

advertorch,gym,opencv-python,atari-py


然后在jupyter notebook运行代码遇到如下问题:

error:cannot import name ‘ListReplayBuffer’ from 'tianshou.data’

更换tianshou版本:https://pypi.org/project/tianshou/#history


error:TqdmWarning: IProgress not found. Please update jupyter and ipywidgets.

https://blog.csdn.net/buluxianfeng/article/details/123316251


error:NameNotFound: Environment PongNoFrameskip doesn’t exist.

https://stackoverflow.com/questions/69442971/error-in-importing-environment-openai-gym

pip install gym==0.18.0


Exception: ROM is missing for pong, see https://github.com/openai/atari-py#roms for instructions

python -m atari_py.import_roms jupyter/Roms work!

2、如何指定GPU

查看GPU情况:https://blog.csdn.net/dcrmg/article/details/78146797。

pytorch指定gpu:https://blog.csdn.net/LLY_A_/article/details/119488452

https://blog.csdn.net/weixin_43402775/article/details/109223794


UserWarning:NVIDIA GeForce RTX 3080 Ti with CUDA capability sm_86 is not compatible with the current PyTorch installation.The current PyTorch install supports CUDA capabilities sm_37 sm_50 sm_60 sm_61 sm_70 sm_75 compute_37.

https://blog.csdn.net/weixin_44120025/article/details/121747212

算力为8.x的显卡使用的cuda版本应该大于等于11.0


有的函数要用到相对路径,因此要:%cd jupyter/rl-policies-attacks-defenses-master


代码中指定GPU:device = 'cuda:1' if torch.cuda.is_available() else 'cpu’


查看、关闭当前服务器上进程:https://blog.csdn.net/jiangyu1013/article/details/82984210

3、用PPO训练chopper command

Train PPO agent to play ChopperCommand.

(14:35~19:12,训练了5h左右;19:55测试完,测试用了1h左右;用的GPU1)

python atari_a2c_ppo.py --env-name "ChopperCommandNoFrameskip-v4" --algo ppo --use-gae --lr 2.5e-4 --clip-param 0.1 --value-loss-coef 0.5 --num-processes 8 --num-steps 128 --num-mini-batch 4 --log-interval 1 --use-linear-lr-decay --entropy-coef 0.01 --cuda-deterministic


Test PPO agent playing ChopperCommand:python atari_a2c_ppo.py --env-name "ChopperCommandNoFrameskip-v4" --algo ppo --resume_path "log/ChopperCommandNoFrameskip-v4/ppo/policy.pth" --watch --test_num 10


测试1:
在这里插入图片描述
在这里插入图片描述


最终测试:

在这里插入图片描述

后来上paperswithcode看sota,最好的模型的Score竟可以上万!不过这里的mean reward和score真的一样吗?paperswithcode.com/task/atari-games


经常出现警告:Visual Studio Code is unable to watch for file changes in this large workspace。应该2个程序一起训练vscode看不过来了?


还有error:Bus error (core dumped)

Train DQN agent to play ChopperCommand.

(用的GPU2)

python atari_dqn.py --task ChopperCommandNoFrameskip-v4

在这里插入图片描述

vscode 连接服务器,为什么跑一会程序就自己中断了?休眠时间更改为“永不”、断国外VPN、改用流量……都不行。应该是图书馆wifi又差了,经过1个小时又连上了。


Test DQN agent playing ChopperCommand:.python atari_dqn.py --resume_path "log/ChopperCommandNoFrameskip-v4/dqn/policy.pth" --watch --test_num 10 --task "PongNoFrameskip-v4”

生成GIF动画

方法:

  • https://blog.csdn.net/qq_33361420/article/details/112471755

  • https://blog.csdn.net/m0_59019651/article/details/124894736

  • https://aistudio.baidu.com/aistudio/projectdetail/4824545

  • https://blog.csdn.net/sailist/article/details/79502007

  • 报错:https://stackoverflow.com/questions/53472940/nameerror-name-base-is-not-defined-openai-gym

  • 改版本:https://github.com/pyglet/pyglet/tags?after=v2.0.dev2

  • Cannot connect to "None”

    https://stackoverflow.com/questions/40195740/how-to-run-openai-gym-render-over-a-server

  • https://github.com/openai/atari-py/blob/master/atari_py/ale_interface/src/ale_interface.cpp

这篇关于rl-policies-attacks 代码 Debug 记录的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!


原文地址:https://blog.csdn.net/YABTL/article/details/127787744
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.chinasem.cn/article/178615

相关文章

jupyter代码块没有运行图标的解决方案

《jupyter代码块没有运行图标的解决方案》:本文主要介绍jupyter代码块没有运行图标的解决方案,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录jupyter代码块没有运行图标的解决1.找到Jupyter notebook的系统配置文件2.这时候一般会搜索到

Python通过模块化开发优化代码的技巧分享

《Python通过模块化开发优化代码的技巧分享》模块化开发就是把代码拆成一个个“零件”,该封装封装,该拆分拆分,下面小编就来和大家简单聊聊python如何用模块化开发进行代码优化吧... 目录什么是模块化开发如何拆分代码改进版:拆分成模块让模块更强大:使用 __init__.py你一定会遇到的问题模www.

Python获取中国节假日数据记录入JSON文件

《Python获取中国节假日数据记录入JSON文件》项目系统内置的日历应用为了提升用户体验,特别设置了在调休日期显示“休”的UI图标功能,那么问题是这些调休数据从哪里来呢?我尝试一种更为智能的方法:P... 目录节假日数据获取存入jsON文件节假日数据读取封装完整代码项目系统内置的日历应用为了提升用户体验,

springboot循环依赖问题案例代码及解决办法

《springboot循环依赖问题案例代码及解决办法》在SpringBoot中,如果两个或多个Bean之间存在循环依赖(即BeanA依赖BeanB,而BeanB又依赖BeanA),会导致Spring的... 目录1. 什么是循环依赖?2. 循环依赖的场景案例3. 解决循环依赖的常见方法方法 1:使用 @La

使用C#代码在PDF文档中添加、删除和替换图片

《使用C#代码在PDF文档中添加、删除和替换图片》在当今数字化文档处理场景中,动态操作PDF文档中的图像已成为企业级应用开发的核心需求之一,本文将介绍如何在.NET平台使用C#代码在PDF文档中添加、... 目录引言用C#添加图片到PDF文档用C#删除PDF文档中的图片用C#替换PDF文档中的图片引言在当

C#使用SQLite进行大数据量高效处理的代码示例

《C#使用SQLite进行大数据量高效处理的代码示例》在软件开发中,高效处理大数据量是一个常见且具有挑战性的任务,SQLite因其零配置、嵌入式、跨平台的特性,成为许多开发者的首选数据库,本文将深入探... 目录前言准备工作数据实体核心技术批量插入:从乌龟到猎豹的蜕变分页查询:加载百万数据异步处理:拒绝界面

用js控制视频播放进度基本示例代码

《用js控制视频播放进度基本示例代码》写前端的时候,很多的时候是需要支持要网页视频播放的功能,下面这篇文章主要给大家介绍了关于用js控制视频播放进度的相关资料,文中通过代码介绍的非常详细,需要的朋友可... 目录前言html部分:JavaScript部分:注意:总结前言在javascript中控制视频播放

Spring Boot 配置文件之类型、加载顺序与最佳实践记录

《SpringBoot配置文件之类型、加载顺序与最佳实践记录》SpringBoot的配置文件是灵活且强大的工具,通过合理的配置管理,可以让应用开发和部署更加高效,无论是简单的属性配置,还是复杂... 目录Spring Boot 配置文件详解一、Spring Boot 配置文件类型1.1 applicatio

Spring Boot 3.4.3 基于 Spring WebFlux 实现 SSE 功能(代码示例)

《SpringBoot3.4.3基于SpringWebFlux实现SSE功能(代码示例)》SpringBoot3.4.3结合SpringWebFlux实现SSE功能,为实时数据推送提供... 目录1. SSE 简介1.1 什么是 SSE?1.2 SSE 的优点1.3 适用场景2. Spring WebFlu

java之Objects.nonNull用法代码解读

《java之Objects.nonNull用法代码解读》:本文主要介绍java之Objects.nonNull用法代码,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐... 目录Java之Objects.nonwww.chinasem.cnNull用法代码Objects.nonN