NVIDIA AI 研究科学家Jim Fan:人工智能探索中的下一个重大挑战:“基础代理”

本文主要是介绍NVIDIA AI 研究科学家Jim Fan:人工智能探索中的下一个重大挑战:“基础代理”,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

NVIDIA AI 的研究科学家 Jim Fan 在TED做了一次关于Foundation Agent的分享,我看完感到非常震撼,反复看了好几遍。这里给大家分享下我整理的简要中文文字版,想看英文原视频的见文章最底部的链接。

人工通用智能的研究框架

Jim Fan 认为现在针对一般能力的人工智能代理的研究工作主要是围绕着三个轴,分别是:代理可以执行的技能数量(能力),代理可以控制的身体形式或体现(具身化),以及代理可以掌握现实的能力(感受现实和反应)。

人工通用智能的研究目标

他之前被AlphaGo战胜世界围棋冠军感到震撼,但是后来发现AlphaGo的技能太少了,只会下围棋。他认为人工智能代理的目标是右上方,也就是技能,具身化和现实三个轴同时都有不错的能力的人工智能agent。

能力学习方向 Voyager

能力轴上他分享了他领导研究的 Voyager,这是一个在《我的世界》游戏中可以大规模扩展多种技能的代理。只需要给Voyager设定一个高层目标“尽可能获得多的独特物品”,然后它就可以自己不断地玩游戏,探索地形,开采各种材料,对抗怪物,制作数百种食谱等等,并解锁不断扩大的技能树。

这个代理的核心是将编码作为行动。首先,研究人员将3D世界转换为文本表示,然后调用GPT4编写js代码,这些js代码将成为游戏中的技能。代码写错了,有bug怎么办?那就增加一个“自我反思机制”来改进和提高。它利用三种反馈源:代码编译或执行报错,agent自身的状态(生命值,饥饿值等等)还有世界状态(附近的地形和物体,比如森林,树木,动物,金属等等)。

Voyager 根据自身状态和世界状态采取一个行动(写一段代码),观察行动对自身状态和世界状态的影响(观察代码是否可以正确运行,以及运行后对自己和世界的影响),反思如何做得更好(根据代码错误、代码执行后的影响反馈调整代码,使得代码可以正确编译运行并带来正收益)。它不断地尝试新的行动和计划,并反复进行。一旦技能成熟(代码可以编译和运行,并且运行后可以获得正收益),Voyager 就把它保存到技能库中,后边可以持续使用。技能库其实就是一个代码库,可以执行并且执行后能得到正反馈的代码保存在里边。

在这个探索过程中,Voyager不仅能掌握技能,还可以发现新技能。而这一切并没有预编程,都是Voyager自己的主意。这里可以看到一个终身学习的人工智能的雏形。agent永远好奇,永远追求新的尝试。相比AlphaGo,Voyager大幅拓展了agent能做的许多事情。

具身化方向 MetaMorph

虽然Voyager学会了很多技能,但它只能在《我的世界》中控制一个角色。那能不能有一个算法,可以控制不同的身体或其他形式的体现?MetaMorph就是这样一个研究项目。

这是一个基础模型,它可以同时控制成千上万的具有不同的手臂和腿部配置的机器人。MetaMorph 能够同时处理不同机器人身体的极其不同的运动特性。

MetaMorph的核心思想如下图所示,首先创造不同的词汇表来描述身体部位,这样每个机器人身体基本就是一个用词汇表编写的句子。然后将这些句子输入到类似于ChatGPT的tranformer结构中,但是这个transformer不是像ChatGPT那样输出文字,而是输出电机控制指令。

MetaMorph能够控制数千个机器人上楼,穿越复杂地形以及避开障碍物。未来,如果我们能够大大拓展这个机器人的词汇量,MetaMorph 2.0 应该可以推广到机器人手,人形机器人手,狗,无人机甚至其他具身形态。

现实感知和反应方向 IsaacSim

IsaacSim 最大的优势是加速物理模拟,它可以比现实中快1000倍以上。

比如上图的机器人手练习,以及下图的机器人学习武术,它可以仅用三天的模拟时间就可以完成在现实中要十年才能完成的刻苦练习。这很像《黑客帝国》中的虚拟陪练道场。

更重要的是,IsaacSim可以按程序生成世界,具有无限的变化,因此没有两个看起来是相同的。一个有趣的想法,如果agent可以掌握1万次模拟,那么也许就可以推广到现实中,这就是第1万零1个现实。

Foundation Agent

当我们在下图沿着不同的轴往前走的,我们最终会达到右上角,这就是Foundation Agent。这是一个具备三个轴的能力的代理。

Jim Fan 认为训练Foundation Agent将与训练ChatGPT非常相似。ChatGPT是文本进去,文本出来。

Foundation Agent就是具身化提示和任务提示进去,行动出来。

Jin Fan最后表示:他坚信未来所有可以移动的东西都将实现自主控制。

TED视频链接:

https://www.ted.com/talks/jim_fan_the_next_grand_challenge_for_ai

这篇关于NVIDIA AI 研究科学家Jim Fan:人工智能探索中的下一个重大挑战:“基础代理”的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/654695

相关文章

关于Java内存访问重排序的研究

《关于Java内存访问重排序的研究》文章主要介绍了重排序现象及其在多线程编程中的影响,包括内存可见性问题和Java内存模型中对重排序的规则... 目录什么是重排序重排序图解重排序实验as-if-serial语义内存访问重排序与内存可见性内存访问重排序与Java内存模型重排序示意表内存屏障内存屏障示意表Int

Ilya-AI分享的他在OpenAI学习到的15个提示工程技巧

Ilya(不是本人,claude AI)在社交媒体上分享了他在OpenAI学习到的15个Prompt撰写技巧。 以下是详细的内容: 提示精确化:在编写提示时,力求表达清晰准确。清楚地阐述任务需求和概念定义至关重要。例:不用"分析文本",而用"判断这段话的情感倾向:积极、消极还是中性"。 快速迭代:善于快速连续调整提示。熟练的提示工程师能够灵活地进行多轮优化。例:从"总结文章"到"用

AI绘图怎么变现?想做点副业的小白必看!

在科技飞速发展的今天,AI绘图作为一种新兴技术,不仅改变了艺术创作的方式,也为创作者提供了多种变现途径。本文将详细探讨几种常见的AI绘图变现方式,帮助创作者更好地利用这一技术实现经济收益。 更多实操教程和AI绘画工具,可以扫描下方,免费获取 定制服务:个性化的创意商机 个性化定制 AI绘图技术能够根据用户需求生成个性化的头像、壁纸、插画等作品。例如,姓氏头像在电商平台上非常受欢迎,

基于人工智能的图像分类系统

目录 引言项目背景环境准备 硬件要求软件安装与配置系统设计 系统架构关键技术代码示例 数据预处理模型训练模型预测应用场景结论 1. 引言 图像分类是计算机视觉中的一个重要任务,目标是自动识别图像中的对象类别。通过卷积神经网络(CNN)等深度学习技术,我们可以构建高效的图像分类系统,广泛应用于自动驾驶、医疗影像诊断、监控分析等领域。本文将介绍如何构建一个基于人工智能的图像分类系统,包括环境

从去中心化到智能化:Web3如何与AI共同塑造数字生态

在数字时代的演进中,Web3和人工智能(AI)正成为塑造未来互联网的两大核心力量。Web3的去中心化理念与AI的智能化技术,正相互交织,共同推动数字生态的变革。本文将探讨Web3与AI的融合如何改变数字世界,并展望这一新兴组合如何重塑我们的在线体验。 Web3的去中心化愿景 Web3代表了互联网的第三代发展,它基于去中心化的区块链技术,旨在创建一个开放、透明且用户主导的数字生态。不同于传统

跨国公司撤出在华研发中心的启示:中国IT产业的挑战与机遇

近日,IBM中国宣布撤出在华的两大研发中心,这一决定在IT行业引发了广泛的讨论和关注。跨国公司在华研发中心的撤出,不仅对众多IT从业者的职业发展带来了直接的冲击,也引发了人们对全球化背景下中国IT产业竞争力和未来发展方向的深思。面对这一突如其来的变化,我们应如何看待跨国公司的决策?中国IT人才又该如何应对?中国IT产业将何去何从?本文将围绕这些问题展开探讨。 跨国公司撤出的背景与

AI一键生成 PPT

AI一键生成 PPT 操作步骤 作为一名打工人,是不是经常需要制作各种PPT来分享我的生活和想法。但是,你们知道,有时候灵感来了,时间却不够用了!😩直到我发现了Kimi AI——一个能够自动生成PPT的神奇助手!🌟 什么是Kimi? 一款月之暗面科技有限公司开发的AI办公工具,帮助用户快速生成高质量的演示文稿。 无论你是职场人士、学生还是教师,Kimi都能够为你的办公文

深入探索协同过滤:从原理到推荐模块案例

文章目录 前言一、协同过滤1. 基于用户的协同过滤(UserCF)2. 基于物品的协同过滤(ItemCF)3. 相似度计算方法 二、相似度计算方法1. 欧氏距离2. 皮尔逊相关系数3. 杰卡德相似系数4. 余弦相似度 三、推荐模块案例1.基于文章的协同过滤推荐功能2.基于用户的协同过滤推荐功能 前言     在信息过载的时代,推荐系统成为连接用户与内容的桥梁。本文聚焦于

高效+灵活,万博智云全球发布AWS无代理跨云容灾方案!

摘要 近日,万博智云推出了基于AWS的无代理跨云容灾解决方案,并与拉丁美洲,中东,亚洲的合作伙伴面向全球开展了联合发布。这一方案以AWS应用环境为基础,将HyperBDR平台的高效、灵活和成本效益优势与无代理功能相结合,为全球企业带来实现了更便捷、经济的数据保护。 一、全球联合发布 9月2日,万博智云CEO Michael Wong在线上平台发布AWS无代理跨云容灾解决方案的阐述视频,介绍了

Andrej Karpathy最新采访:认知核心模型10亿参数就够了,AI会打破教育不公的僵局

夕小瑶科技说 原创  作者 | 海野 AI圈子的红人,AI大神Andrej Karpathy,曾是OpenAI联合创始人之一,特斯拉AI总监。上一次的动态是官宣创办一家名为 Eureka Labs 的人工智能+教育公司 ,宣布将长期致力于AI原生教育。 近日,Andrej Karpathy接受了No Priors(投资博客)的采访,与硅谷知名投资人 Sara Guo 和 Elad G