谷歌 DeepMind 联合斯坦福推出了主从式遥操作双臂机器人系统增强版ALOHA 2

本文主要是介绍谷歌 DeepMind 联合斯坦福推出了主从式遥操作双臂机器人系统增强版ALOHA 2,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

谷歌 DeepMind 联合斯坦福推出了 ALOHA 的增强版本 ——ALOHA 2。与一代相比,ALOHA 2 具有更强的性能、人体工程学设计和稳健性,且成本还不到 20 万元人民币。并且,为了加速大规模双手操作的研究,ALOHA 2 相关的所有硬件设计全部开源了,并提供了详细的教程,以及具有系统识别功能的 ALOHA 2 MuJoCo 模型。谷歌 DeepMind 放出了相关论文《ALOHA 2: An Enhanced Low-Cost Hardware for Bimanual Teleoperation》。

论文地址:https://aloha-2.github.io/assets/aloha2.pdf

项目主页:https://aloha-2.github.io/

我们先来一睹升级后的 ALOHA 2 能做些什么,比如将不同的玩具放进三个不同的碗里。

玩杂耍,你扔我接。

图片

开可乐瓶并将可乐倒进别的杯子里、开酸奶盒。

图片

给熊猫玩偶戴上美瞳。

图片

更难以想象的是,它还能变身扒手,悄无声息拿走你的钱包,并给你放回去。

图片

简直绝了!ALOHA 2 显著提高了一代 ALOHA 的耐用性,从而能够在更复杂的任务上进行大规模数据收集。

相较于一代,ALOHA 2 都升级了些啥

为支持对复杂操作任务的研究,在 ALOHA 平台上扩大数据收集的规模成为目标之一,包括使用的机器人数量、每台机器人的数据收集小时数以及数据收集的多样性。这一扩展过程改变了相对于第一代 ALOHA 平台的要求和范围。

对于 ALOHA 2,除了在 ALOHA 平台的基础上建设,研究者还针对以下领域寻求进一步改进:

性能和任务范围:增强 ALOHA 性能的关键组件,包括夹持器和控制器,以实现更广泛的操控任务。

用户友好性和人体工学:为了优化大规模数据收集,优先考虑用户体验和舒适度,包括改进用户界面系统的响应性和人体工学设计。

稳健性:增加系统的稳健性,最大限度地减少因诊断和维修造成的停机时间。这就需要简化机械设计,并确保更大规模的机器人队伍在整体上易于维护。

根据上述目标,ALOHA 2 的具体改进如下:

夹持器:研究者为主/从机器人的夹持器设计了新的低摩擦轨道。对于主机器人,这改善了遥操作的人体工学和响应速度。对于随动机器人,这改善了延迟和夹持器的力量输出。此外,他们还升级了手指上的抓胶带材料,以提高耐用性和抓取小物体的能力。

重力补偿:研究者使用现成的组件创建了一个被动的重力补偿机制,与 ALOHA 原有的抓带材料系统相比,这提高了耐用性。

框架:研究者简化了围绕工作单元的框架,同时保持了相机安装点的刚性。这些变化为人机协作者和机器人互动的道具提供了空间。

相机:ALOHA 2 使用更小的英特尔 RealSense D405 相机和定制的 3D 打印相机支架,以减小跟随臂的占地面积,从而减少对操作任务的阻碍。这些摄像头还具有更大的视场角、深度、全局快门和更多的定制功能。

模拟:研究者在 MuJoCo Menagerie 中的 MuJoCo 模型中模拟了 ALOHA 2 机器人的精确规格,从而改进了数据收集、策略学习和模拟评估,以应对具有挑战性的操纵任务。

夹持器

为了使遥控操作更顺畅,并改善人体工程学,本次采用了低摩擦轨道设计,降低了机械复杂性,从而取代了 ALOHA 原有的剪刀导轨式机械手设计。

图片

研究者设计并制造了低摩擦随动机械手,取代了 ALOHA 最初的设计。较低的摩擦减少了领导机器人和跟随机器人夹持器之间感知的延迟,显著改善了远程操作期间的用户体验。

框架

研究者重新设计了支撑框架,并使用 20x20mm 铝型材将其制成。框架为领导机器人和重力补偿系统提供支撑,并为俯视摄像机和虫眼摄像机提供安装点。

在这里插入图片描述

与 ALOHA 相比,本次设计进行了简化,去掉了工作台与遥控操作员相对一侧的垂直框架。增加的空间使数据收集方式更加多样化。例如,人类协作者可以更轻松地站在工作区的对面与机器人互动,从而收集人机互动数据。此外,还可以在工作台前摆放较大的道具,让机器人与之互动。

在这里插入图片描述

模拟

研究者发布了用于 ALOHA 2 工作单元的 MuJoCo Menagerie 模型,它对于远程操作和模拟学习非常有用。

与之前发布的 ALOHA 模型相比,MuJoCo 的物理精度更高、视觉保真度更高,允许快速、直观、可扩展的模拟数据收集。

在这里插入图片描述

MuJoCo 模型渲染。

图片

模拟远程操作任务。

以下为使用 Google Scanned Objects Dataset 与 MuJoCo 模型进行远程操作的示例(1 倍速度):

图片

这篇关于谷歌 DeepMind 联合斯坦福推出了主从式遥操作双臂机器人系统增强版ALOHA 2的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/693991

相关文章

Python FastAPI+Celery+RabbitMQ实现分布式图片水印处理系统

《PythonFastAPI+Celery+RabbitMQ实现分布式图片水印处理系统》这篇文章主要为大家详细介绍了PythonFastAPI如何结合Celery以及RabbitMQ实现简单的分布式... 实现思路FastAPI 服务器Celery 任务队列RabbitMQ 作为消息代理定时任务处理完整

Linux系统中卸载与安装JDK的详细教程

《Linux系统中卸载与安装JDK的详细教程》本文详细介绍了如何在Linux系统中通过Xshell和Xftp工具连接与传输文件,然后进行JDK的安装与卸载,安装步骤包括连接Linux、传输JDK安装包... 目录1、卸载1.1 linux删除自带的JDK1.2 Linux上卸载自己安装的JDK2、安装2.1

Mysql表的简单操作(基本技能)

《Mysql表的简单操作(基本技能)》在数据库中,表的操作主要包括表的创建、查看、修改、删除等,了解如何操作这些表是数据库管理和开发的基本技能,本文给大家介绍Mysql表的简单操作,感兴趣的朋友一起看... 目录3.1 创建表 3.2 查看表结构3.3 修改表3.4 实践案例:修改表在数据库中,表的操作主要

C# WinForms存储过程操作数据库的实例讲解

《C#WinForms存储过程操作数据库的实例讲解》:本文主要介绍C#WinForms存储过程操作数据库的实例,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录一、存储过程基础二、C# 调用流程1. 数据库连接配置2. 执行存储过程(增删改)3. 查询数据三、事务处

Java使用Curator进行ZooKeeper操作的详细教程

《Java使用Curator进行ZooKeeper操作的详细教程》ApacheCurator是一个基于ZooKeeper的Java客户端库,它极大地简化了使用ZooKeeper的开发工作,在分布式系统... 目录1、简述2、核心功能2.1 CuratorFramework2.2 Recipes3、示例实践3

Java利用JSONPath操作JSON数据的技术指南

《Java利用JSONPath操作JSON数据的技术指南》JSONPath是一种强大的工具,用于查询和操作JSON数据,类似于SQL的语法,它为处理复杂的JSON数据结构提供了简单且高效... 目录1、简述2、什么是 jsONPath?3、Java 示例3.1 基本查询3.2 过滤查询3.3 递归搜索3.4

Python使用DrissionPage中ChromiumPage进行自动化网页操作

《Python使用DrissionPage中ChromiumPage进行自动化网页操作》DrissionPage作为一款轻量级且功能强大的浏览器自动化库,为开发者提供了丰富的功能支持,本文将使用Dri... 目录前言一、ChromiumPage基础操作1.初始化Drission 和 ChromiumPage

利用Go语言开发文件操作工具轻松处理所有文件

《利用Go语言开发文件操作工具轻松处理所有文件》在后端开发中,文件操作是一个非常常见但又容易出错的场景,本文小编要向大家介绍一个强大的Go语言文件操作工具库,它能帮你轻松处理各种文件操作场景... 目录为什么需要这个工具?核心功能详解1. 文件/目录存javascript在性检查2. 批量创建目录3. 文件

Linux系统之主机网络配置方式

《Linux系统之主机网络配置方式》:本文主要介绍Linux系统之主机网络配置方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录一、查看主机的网络参数1、查看主机名2、查看IP地址3、查看网关4、查看DNS二、配置网卡1、修改网卡配置文件2、nmcli工具【通用

Linux系统之dns域名解析全过程

《Linux系统之dns域名解析全过程》:本文主要介绍Linux系统之dns域名解析全过程,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录一、dns域名解析介绍1、DNS核心概念1.1 区域 zone1.2 记录 record二、DNS服务的配置1、正向解析的配置