NVIDIA AI 研究科学家Jim Fan:人工智能探索中的下一个重大挑战:“基础代理”

本文主要是介绍NVIDIA AI 研究科学家Jim Fan:人工智能探索中的下一个重大挑战:“基础代理”,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

NVIDIA AI 的研究科学家 Jim Fan 在TED做了一次关于Foundation Agent的分享,我看完感到非常震撼,反复看了好几遍。这里给大家分享下我整理的简要中文文字版,想看英文原视频的见文章最底部的链接。

人工通用智能的研究框架

Jim Fan 认为现在针对一般能力的人工智能代理的研究工作主要是围绕着三个轴,分别是:代理可以执行的技能数量(能力),代理可以控制的身体形式或体现(具身化),以及代理可以掌握现实的能力(感受现实和反应)。

人工通用智能的研究目标

他之前被AlphaGo战胜世界围棋冠军感到震撼,但是后来发现AlphaGo的技能太少了,只会下围棋。他认为人工智能代理的目标是右上方,也就是技能,具身化和现实三个轴同时都有不错的能力的人工智能agent。

能力学习方向 Voyager

能力轴上他分享了他领导研究的 Voyager,这是一个在《我的世界》游戏中可以大规模扩展多种技能的代理。只需要给Voyager设定一个高层目标“尽可能获得多的独特物品”,然后它就可以自己不断地玩游戏,探索地形,开采各种材料,对抗怪物,制作数百种食谱等等,并解锁不断扩大的技能树。

这个代理的核心是将编码作为行动。首先,研究人员将3D世界转换为文本表示,然后调用GPT4编写js代码,这些js代码将成为游戏中的技能。代码写错了,有bug怎么办?那就增加一个“自我反思机制”来改进和提高。它利用三种反馈源:代码编译或执行报错,agent自身的状态(生命值,饥饿值等等)还有世界状态(附近的地形和物体,比如森林,树木,动物,金属等等)。

Voyager 根据自身状态和世界状态采取一个行动(写一段代码),观察行动对自身状态和世界状态的影响(观察代码是否可以正确运行,以及运行后对自己和世界的影响),反思如何做得更好(根据代码错误、代码执行后的影响反馈调整代码,使得代码可以正确编译运行并带来正收益)。它不断地尝试新的行动和计划,并反复进行。一旦技能成熟(代码可以编译和运行,并且运行后可以获得正收益),Voyager 就把它保存到技能库中,后边可以持续使用。技能库其实就是一个代码库,可以执行并且执行后能得到正反馈的代码保存在里边。

在这个探索过程中,Voyager不仅能掌握技能,还可以发现新技能。而这一切并没有预编程,都是Voyager自己的主意。这里可以看到一个终身学习的人工智能的雏形。agent永远好奇,永远追求新的尝试。相比AlphaGo,Voyager大幅拓展了agent能做的许多事情。

具身化方向 MetaMorph

虽然Voyager学会了很多技能,但它只能在《我的世界》中控制一个角色。那能不能有一个算法,可以控制不同的身体或其他形式的体现?MetaMorph就是这样一个研究项目。

这是一个基础模型,它可以同时控制成千上万的具有不同的手臂和腿部配置的机器人。MetaMorph 能够同时处理不同机器人身体的极其不同的运动特性。

MetaMorph的核心思想如下图所示,首先创造不同的词汇表来描述身体部位,这样每个机器人身体基本就是一个用词汇表编写的句子。然后将这些句子输入到类似于ChatGPT的tranformer结构中,但是这个transformer不是像ChatGPT那样输出文字,而是输出电机控制指令。

MetaMorph能够控制数千个机器人上楼,穿越复杂地形以及避开障碍物。未来,如果我们能够大大拓展这个机器人的词汇量,MetaMorph 2.0 应该可以推广到机器人手,人形机器人手,狗,无人机甚至其他具身形态。

现实感知和反应方向 IsaacSim

IsaacSim 最大的优势是加速物理模拟,它可以比现实中快1000倍以上。

比如上图的机器人手练习,以及下图的机器人学习武术,它可以仅用三天的模拟时间就可以完成在现实中要十年才能完成的刻苦练习。这很像《黑客帝国》中的虚拟陪练道场。

更重要的是,IsaacSim可以按程序生成世界,具有无限的变化,因此没有两个看起来是相同的。一个有趣的想法,如果agent可以掌握1万次模拟,那么也许就可以推广到现实中,这就是第1万零1个现实。

Foundation Agent

当我们在下图沿着不同的轴往前走的,我们最终会达到右上角,这就是Foundation Agent。这是一个具备三个轴的能力的代理。

Jim Fan 认为训练Foundation Agent将与训练ChatGPT非常相似。ChatGPT是文本进去,文本出来。

Foundation Agent就是具身化提示和任务提示进去,行动出来。

Jin Fan最后表示:他坚信未来所有可以移动的东西都将实现自主控制。

TED视频链接:

https://www.ted.com/talks/jim_fan_the_next_grand_challenge_for_ai

这篇关于NVIDIA AI 研究科学家Jim Fan:人工智能探索中的下一个重大挑战:“基础代理”的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/654695

相关文章

Spring AI集成DeepSeek的详细步骤

《SpringAI集成DeepSeek的详细步骤》DeepSeek作为一款卓越的国产AI模型,越来越多的公司考虑在自己的应用中集成,对于Java应用来说,我们可以借助SpringAI集成DeepSe... 目录DeepSeek 介绍Spring AI 是什么?1、环境准备2、构建项目2.1、pom依赖2.2

使用 sql-research-assistant进行 SQL 数据库研究的实战指南(代码实现演示)

《使用sql-research-assistant进行SQL数据库研究的实战指南(代码实现演示)》本文介绍了sql-research-assistant工具,该工具基于LangChain框架,集... 目录技术背景介绍核心原理解析代码实现演示安装和配置项目集成LangSmith 配置(可选)启动服务应用场景

pip install jupyterlab失败的原因问题及探索

《pipinstalljupyterlab失败的原因问题及探索》在学习Yolo模型时,尝试安装JupyterLab但遇到错误,错误提示缺少Rust和Cargo编译环境,因为pywinpty包需要它... 目录背景问题解决方案总结背景最近在学习Yolo模型,然后其中要下载jupyter(有点LSVmu像一个

0基础租个硬件玩deepseek,蓝耘元生代智算云|本地部署DeepSeek R1模型的操作流程

《0基础租个硬件玩deepseek,蓝耘元生代智算云|本地部署DeepSeekR1模型的操作流程》DeepSeekR1模型凭借其强大的自然语言处理能力,在未来具有广阔的应用前景,有望在多个领域发... 目录0基础租个硬件玩deepseek,蓝耘元生代智算云|本地部署DeepSeek R1模型,3步搞定一个应

Deepseek R1模型本地化部署+API接口调用详细教程(释放AI生产力)

《DeepseekR1模型本地化部署+API接口调用详细教程(释放AI生产力)》本文介绍了本地部署DeepSeekR1模型和通过API调用将其集成到VSCode中的过程,作者详细步骤展示了如何下载和... 目录前言一、deepseek R1模型与chatGPT o1系列模型对比二、本地部署步骤1.安装oll

Spring AI Alibaba接入大模型时的依赖问题小结

《SpringAIAlibaba接入大模型时的依赖问题小结》文章介绍了如何在pom.xml文件中配置SpringAIAlibaba依赖,并提供了一个示例pom.xml文件,同时,建议将Maven仓... 目录(一)pom.XML文件:(二)application.yml配置文件(一)pom.xml文件:首

SpringBoot整合DeepSeek实现AI对话功能

《SpringBoot整合DeepSeek实现AI对话功能》本文介绍了如何在SpringBoot项目中整合DeepSeekAPI和本地私有化部署DeepSeekR1模型,通过SpringAI框架简化了... 目录Spring AI版本依赖整合DeepSeek API key整合本地化部署的DeepSeek

PyCharm接入DeepSeek实现AI编程的操作流程

《PyCharm接入DeepSeek实现AI编程的操作流程》DeepSeek是一家专注于人工智能技术研发的公司,致力于开发高性能、低成本的AI模型,接下来,我们把DeepSeek接入到PyCharm中... 目录引言效果演示创建API key在PyCharm中下载Continue插件配置Continue引言

Ubuntu系统怎么安装Warp? 新一代AI 终端神器安装使用方法

《Ubuntu系统怎么安装Warp?新一代AI终端神器安装使用方法》Warp是一款使用Rust开发的现代化AI终端工具,该怎么再Ubuntu系统中安装使用呢?下面我们就来看看详细教程... Warp Terminal 是一款使用 Rust 开发的现代化「AI 终端」工具。最初它只支持 MACOS,但在 20

MySQL中my.ini文件的基础配置和优化配置方式

《MySQL中my.ini文件的基础配置和优化配置方式》文章讨论了数据库异步同步的优化思路,包括三个主要方面:幂等性、时序和延迟,作者还分享了MySQL配置文件的优化经验,并鼓励读者提供支持... 目录mysql my.ini文件的配置和优化配置优化思路MySQL配置文件优化总结MySQL my.ini文件