搭建强化学习的机械臂MuJoCo环境以及urdf转xml文件方法

2024-04-25 22:12

本文主要是介绍搭建强化学习的机械臂MuJoCo环境以及urdf转xml文件方法,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

一、背景

基于强化学习的机械臂应用日趋广泛,摆脱了基于模型到达固定点的束缚。基于强化学习算法,机械臂可以完成拧魔方、推抓任务(Andy Zeng的经典论文),暂且想一下如果用传统方法完成此类复杂任务是何等困难。

强化学习作为一种试错的方式,在真实机械臂上进行训练不仅耗时,且会对环境或机器造成损坏,而在仿真环境中进行训练是一种可行的方式。MuJoCo作为当前主流的强化学习化境配置较为繁琐,这里简要记录下我的配置和使用过程。

二、MuJoCo安装

1.ubuntu18.04配置强化学习环境流程

(1)安装anaconda
官网下载anaconda脚本,进入脚本保存的目录,终端bash Anaconda3-2021.05-Linux-x86_64.sh
创建名为drl(自定义)的python3.6环境,并激活环境conda create -n drl python=3.6 anaconda
conda activate drl
启动anaconda命令:anaconda-navigator

(2)安装mujoco
官网下载mujoco200_linux.zip,在主目录下新建.mujoco文件夹,将mujoco200_linux.zip文件复制并解压到.mujoco文件夹,
解压后的文件不要使用mujoco200_linux这个名字,改为mujoco200
接着把下载好的密钥mjkey.txt分别复制到.mujoco和mujoco200/bin里

cp mjkey.txt ~/.mujoco
cp mjkey.txt ~/.mujoco/mujoco200/bin

添加环境变量,这里我添加的条数比其他教程上的要多,是我经过反复试验比较才确定的这种添加最后才不会报错。
打开bashrc文本: gedit ~/.bashrc

在.bashrc文本里添加:

export LD_LIBRARY_PATH=~/.mujoco/mujoco200/bin${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/home/dlut/.mujoco/mujoco200/bin
export MUJOCO_KEY_PATH=~/.mujoco${MUJOCO_KEY_PATH}

下面三条看情况添加,一般不用加

export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/lib/nvidia
export PATH="$LD_LIBRARY_PATH:$PATH"
export LD_PRELOAD=/usr/lib/x86_64-linux-gnu/libGLEW.so

保存文件ctrl+s并退出文本,接着激活一下:source ~/.bashrc

测试mujoco200是否安装成功:

cd ~/.mujoco/mujoco2000/bin
./simulate ../model/humanoid.xml

提示:解压命令unzip mujoco200.zip

(3)安装mujoco-py
先用anaconda激活虚拟环境 conda activate spinningup
运行下面代码:

sudo apt update
sudo apt-get install patchelf
sudo apt-get install python3-dev build-essential libssl-dev libffi-dev libxml2-dev  
sudo apt-get install libxslt1-dev zlib1g-dev libglew1.5 libglew-dev python3-pip

下载mujoco-py安装包,这里我们直接用git克隆过来

sudo apt install git
cd ~/.mujoco
git clone https://github.com/openai/mujoco-py
cd mujoco-py
pip install -r requirements.txt
pip install -r requirements.dev.txt
python setup.py install

重启电脑 reboot
进入环境并输入如下命令:

conda activate spinningup
sudo apt install libosmesa6-dev libgl1-mesa-glx libglfw3

在spinningup环境下 安装

pip install mujoco_py==2.0.2.8

###备选方案

pip3 install -U 'mujoco-py<2.1,>=2.0'

测试:
cd ~/.mujoco/mujoco-py/examples
python3 setting_state.py

至此,mujoco200和mujoco-py安装成功
(4)安装gym
0.进入anacondy虚拟环境 conda activate spinningup
1.git clone https://github.com/openai/gym.git
2.cd gym
3.sudo apt-get install -y python-numpy python-dev cmake zlib1g-dev libjpeg-dev xvfb libav-tools xorg-dev python-opengl libboost-all-dev libsdl2-dev swig
4.pip install -e .[all]

参考:https://zhuanlan.zhihu.com/p/472290066

三、在MuJoCo搭建自己的机械臂模型

在MuJoCo搭建自己的机械臂模型,其实就是将我们所常见的URDF文件转为xml文件,然后添加一些地板或其他环境信息,最后放入到.mujoco的model文件夹下即可。

1、xacro转urdf

因为ros的更新换代,许多机械臂的功能包不再提供urdf文件,而给的是xacro文件,因此第一步是将xacro转为urdf。

xacro转urdf时,xacro文件robot标签下添加

  <mujoco><compiler meshdir="../meshes_mujoco/" 其中../meshes_mujoco改为自己的mesh绝对文件夹路径,mesh文件夹需要和要转的xacro在同一个文件夹下balanceinertia="true" discardvisual="false" /></mujoco>

运行命令:

rosrun xacro xacro --inorder m1n6s300_standalone.xacro > m1n6s300_standalone.urdf 

注意:ubuntu18.04下--inorder可以省略,起到强转化作用。
报错:

resource not found: kinova_description
ROS path [0]=/opt/ros/melodic/share/ros
ROS path [1]=/opt/ros/melodic/share

解决方法:
网友:sudo cp -r ~/catkin_ws/src/mbot_description /opt/ros/melodic/share
将~/catkin_ws/src/mbot_description 修改为自己的路径 即:

sudo cp -r /home/qiucc/dual_ws/src/kinova_ros_melodic_devel/kinova_description  /opt/ros/melodic/share

成功解决!
检查urdf文件:check_urdf model.urdf
在RViz中可视化:
roslaunch urdf_tutorial display.launch model:=path/to/your/urdf/file

2、urdf转xml

在确认URDF模型没有问题后,进入MuJoCo的可执行文件夹内执行命令进行转换(如默认的~/.mujoco/mujoco200/bin):
执行命令:./compile /path/to/model.urdf /path/to/model.xml
即:

./compile /home/qiucc/dual_ws/src/kinova_ros_melodic_devel/kinova_description/urdf/m1n6s300_standalone.urdf /home/qiucc/dual_ws/src/kinova_ros_melodic_devel/kinova_description/urdf/m1n6s300_standalone.xml

若urdf转xml失败,报错为:

Error: Unknown mesh file type: base.dae
Object name = base, id = 0

解决方法:将urdf中的mesh标签中的后缀dae全部修改为stl,重新执行上述./compile命令

若报错:

Error: could not open STL file '/home/qiucc/dual_ws/src/kinova_ros_melodic_devel/kinova_description/urdf/base.stl'
Object name = base, id = 0

是因为没有在urdf加入mujoco的标签:

  <mujoco><compiler meshdir="../meshes_mujoco/" 其中../meshes_mujoco改为自己的mesh绝对文件夹路径,mesh文件夹需要和要转的xacro在同一个文件夹下balanceinertia="true" discardvisual="false" /></mujoco>

转换成功后,将得到的model.xml复制到.mujoco/mujoco200/model文件夹下 (提示:若主文件夹下没有.mujoco,是因为.文件为隐藏文件,快捷键ctrl+h即可显示

3、使用mujoco物理引擎打开.xml文件步骤

进入~/.mujoco/mujoco200/bin
运行命令: ./simulate …/model/model.xml 提示:…是进入上一个文件夹,model.xml为需要打开的xml文件
或者 ./simulate 绝对路径/model.xml

4、注意事项

注意:在使用mujoco建模时,xml文件添加物体时,size的大小是实际大小的一半
例如,添加一个长0.6m,宽0.6m,高1.0m的箱子,则为:

  <body name="desk" pos="0 0.6 -0.71" mocap="true"><geom type="box" size="0.3 0.3 0.5" rgba="0 .9 0 .5" contype="2"/></body>

展示一下我的双臂模型
在这里插入图片描述

四、在MuJoCo修改机械臂的颜色

有时我们导入的机械臂模型是白色的,和真实机械臂外观差别很大,如下图所示,这里介绍修改机械臂颜色的方法。
在这里插入图片描述
修改的地方如下,参考Intelligent-kinova—panda—models—assets—robot—panda—kinova_all_joints.xml

在这里插入图片描述在这里插入图片描述

这篇关于搭建强化学习的机械臂MuJoCo环境以及urdf转xml文件方法的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/935932

相关文章

鸿蒙中Axios数据请求的封装和配置方法

《鸿蒙中Axios数据请求的封装和配置方法》:本文主要介绍鸿蒙中Axios数据请求的封装和配置方法,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友参考下吧... 目录1.配置权限 应用级权限和系统级权限2.配置网络请求的代码3.下载在Entry中 下载AxIOS4.封装Htt

利用Python快速搭建Markdown笔记发布系统

《利用Python快速搭建Markdown笔记发布系统》这篇文章主要为大家详细介绍了使用Python生态的成熟工具,在30分钟内搭建一个支持Markdown渲染、分类标签、全文搜索的私有化知识发布系统... 目录引言:为什么要自建知识博客一、技术选型:极简主义开发栈二、系统架构设计三、核心代码实现(分步解析

Redis实现延迟任务的三种方法详解

《Redis实现延迟任务的三种方法详解》延迟任务(DelayedTask)是指在未来的某个时间点,执行相应的任务,本文为大家整理了三种常见的实现方法,感兴趣的小伙伴可以参考一下... 目录1.前言2.Redis如何实现延迟任务3.代码实现3.1. 过期键通知事件实现3.2. 使用ZSet实现延迟任务3.3

idea maven编译报错Java heap space的解决方法

《ideamaven编译报错Javaheapspace的解决方法》这篇文章主要为大家详细介绍了ideamaven编译报错Javaheapspace的相关解决方法,文中的示例代码讲解详细,感兴趣的... 目录1.增加 Maven 编译的堆内存2. 增加 IntelliJ IDEA 的堆内存3. 优化 Mave

Java String字符串的常用使用方法

《JavaString字符串的常用使用方法》String是JDK提供的一个类,是引用类型,并不是基本的数据类型,String用于字符串操作,在之前学习c语言的时候,对于一些字符串,会初始化字符数组表... 目录一、什么是String二、如何定义一个String1. 用双引号定义2. 通过构造函数定义三、St

浅谈配置MMCV环境,解决报错,版本不匹配问题

《浅谈配置MMCV环境,解决报错,版本不匹配问题》:本文主要介绍浅谈配置MMCV环境,解决报错,版本不匹配问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录配置MMCV环境,解决报错,版本不匹配错误示例正确示例总结配置MMCV环境,解决报错,版本不匹配在col

Spring Security方法级安全控制@PreAuthorize注解的灵活运用小结

《SpringSecurity方法级安全控制@PreAuthorize注解的灵活运用小结》本文将带着大家讲解@PreAuthorize注解的核心原理、SpEL表达式机制,并通过的示例代码演示如... 目录1. 前言2. @PreAuthorize 注解简介3. @PreAuthorize 核心原理解析拦截与

一文详解JavaScript中的fetch方法

《一文详解JavaScript中的fetch方法》fetch函数是一个用于在JavaScript中执行HTTP请求的现代API,它提供了一种更简洁、更强大的方式来处理网络请求,:本文主要介绍Jav... 目录前言什么是 fetch 方法基本语法简单的 GET 请求示例代码解释发送 POST 请求示例代码解释

Feign Client超时时间设置不生效的解决方法

《FeignClient超时时间设置不生效的解决方法》这篇文章主要为大家详细介绍了FeignClient超时时间设置不生效的原因与解决方法,具有一定的的参考价值,希望对大家有一定的帮助... 在使用Feign Client时,可以通过两种方式来设置超时时间:1.针对整个Feign Client设置超时时间

C/C++错误信息处理的常见方法及函数

《C/C++错误信息处理的常见方法及函数》C/C++是两种广泛使用的编程语言,特别是在系统编程、嵌入式开发以及高性能计算领域,:本文主要介绍C/C++错误信息处理的常见方法及函数,文中通过代码介绍... 目录前言1. errno 和 perror()示例:2. strerror()示例:3. perror(