吴恩达:从 Agent 到 Agentic,超越基础模型的下一代 AI

2024-06-20 12:44

本文主要是介绍吴恩达:从 Agent 到 Agentic,超越基础模型的下一代 AI,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

Agentic AI:超越基础模型的下一代 AI — 来自吴恩达的洞察 

“与其争论哪些工作才算是真正的 Agent,不如承认系统可以具有不同程度的 Agentic 特性。” —— 吴恩达

2024年 Snowflake 峰会开发者日上,人工智能领域的领军人物吴恩达 (Andrew Ng) 发表了题为“AI 代理工作流及其推动 AI 进展的潜力 (How AlAgentic workflows could drive more Al progress than even the next generation of foundation models)”的演讲,为我们揭开了 Agentic AI 的神秘面纱,并指出这可能是比下一代基础模型更具潜力的 AI 发展方向。

Agentic AI :从 Agent 到 Agentic,开启 AI 新纪元

近年来,大型语言模型 (LLM) 如 GPT-3、GPT-4 等的出现,为人工智能领域带来了前所未有的突破。然而,传统的 LLM 交互方式更像是一种“非代理型工作流程 (Non-agentic workflow (zero-shot))”,用户输入指令,模型输出结果,缺乏迭代优化的空间,犹如一位才华横溢的作家,却被迫只能按照固定模板写作,无法自由挥洒其创作才能。

Agentic AI 的出现打破了这一僵局,它不再将 AI 系统视为被动接收指令的 Agent,而是赋予其主动思考、规划和执行任务的能力,使其更像是一个能够自主决策的智能体。而实现这一目标的关键,就是“代理型工作流程 (Agentic workflow) ”。

吴恩达指出, Agentic workflow 的核心在于将复杂任务分解成多个步骤,并通过循环迭代的方式逐步优化结果。这种工作方式更接近于人类解决问题的思维模式:

  1. 1. 目标设定: 明确任务目标,例如“写一篇关于 Agentic AI 的文章”。

  2. 2. 规划分解: 将任务分解成多个子任务,例如“确定主题、搜集资料、撰写内容、修改润色”等。

  3. 3. 迭代执行: 依次执行每个子任务,并根据反馈结果进行调整和优化,最终完成目标。

LLM-based agents:Agentic Workflow 大显身手的舞台

吴恩达在演讲中,特别以 “基于 LLM 的智能体 (LLM-based agents)” 为例,展示了 Agentic Workflow 如何提升 AI 系统的性能表现。

传统的 LLM 交互方式类似于“一次性 prompting ”,用户输入一个指令,模型生成一个输出,缺乏迭代优化的空间,难以处理复杂的任务。而 Agentic Workflow 则将 LLM 视为一个智能代理,通过多轮对话和反馈机制,引导 LLM 逐步完善输出结果。

为了验证 Agentic Workflow 的效果,吴恩达的团队进行了一项基于代码生成基准测试集 HumanEval (Coding Benchmark (HumanEval)) 的实验。

实验结果表明,即使是性能相对较弱的 GPT-3.5 模型,在采用 Agentic Workflow 后,其代码生成性能也能超过 GPT-4。下图展示了不同模型在 HumanEval 基准测试中的性能对比:

图片

从图中可以看出,采用 Agentic Workflow 的模型 (橙色点) 普遍取得了优于 Zero-shot 方法的性能表现。这充分证明了 Agentic AI 在突破性能瓶颈方面的巨大潜力。

Agentic vs Agent:一场认知的跃迁

在理解 Agentic AI 的过程中,我们需要厘清一个重要的概念区别:Agent 和 Agentic。

吴恩达在其博客文章中精辟地指出,"Agent" 是一个名词,意味着一种非黑即白的二元划分,而 "Agentic" 则是一个形容词,代表着一种程度概念。

传统的 AI 系统,例如我们熟悉的机器学习算法,大多可以被归类为 Agent。它们接收输入,根据预设的规则进行处理,最终输出结果。然而,Agentic AI 则更进了一步,它不再局限于被动执行指令,而是能够主动感知环境、理解目标,并自主选择行动方案,表现出不同程度的自主性和智能性。

这种从 Agent 到 Agentic 的转变并非一蹴而就,而是一个渐进式的演化过程。正如机器学习领域的发展历程,从早期的线性回归到如今的深度学习,Agentic AI 也需要经历不断的迭代和优化,才能最终实现其全部潜力。

更重要的是, Agentic 这一概念的提出,意味着我们不再纠结于 AI 系统是否真正具备了“智能”,而是将关注点放在了系统能够表现出多少“智能”上。这是一种认知上的重大转变,也是 Agentic AI 区别于传统 AI 的本质特征。

Agentic AI 的应用:从代码生成到视觉任务,重塑各个领域

除了在代码生成领域的突出表现,Agentic AI 在其他领域也展现出巨大的应用潜力,例如:

Vision Agent: 让 AI 看懂世界

在 Snowflake 峰会的演讲中,吴恩达还展示了他的团队开发的一款名为“Vision Agent”的视觉智能体。

Vision Agent 可以像一位经验丰富的程序员一样,根据用户的自然语言指令编写代码,完成各种视觉任务,例如目标检测、图像分割、视频分析等。

例如,用户可以输入指令“帮我找到所有带红色帽子的人”,Vision Agent 就会自动编写代码,识别图像或视频中所有符合条件的目标。

图片

 

Vision Agent 的工作流程如下:

  1. 1. 接收指令: 用户输入自然语言指令,例如“计算鲨鱼和最近的冲浪板之间的距离”。

  2. 2. 生成代码: Vision Agent 根据指令自动生成代码,完成图像处理和分析任务。

  3. 3. 执行代码: 代码被执行,并输出结果,例如鲨鱼和冲浪板之间的距离。

图片

 Vision Agent 的核心是一个名为“Coder Agent”的模块,它负责将自然语言指令转换为可执行的代码。

 

 Coder Agent 的工作原理如下:

  1. 1. 规划: 根据指令,制定一个计划,列出完成任务所需的步骤。

  2. 2. 检索工具: 为每个步骤检索所需的工具,例如图像处理函数、目标检测模型等。

  3. 3. 生成代码: 将计划和工具组合成可执行的代码。

为了进一步提高代码的质量和可靠性,Vision Agent 还引入了一个名为“Tester Agent”的模块,它负责对 Coder Agent 生成的代码进行测试和评估。

图片

 

Coder Agent 的工作原理如下:

  1. 1. 规划: 根据指令,制定一个计划,列出完成任务所需的步骤。

  2. 2. 检索工具: 为每个步骤检索所需的工具,例如图像处理函数、目标检测模型等。

  3. 3. 生成代码: 将计划和工具组合成可执行的代码。

为了进一步提高代码的质量和可靠性,Vision Agent 还引入了一个名为“Tester Agent”的模块,它负责对 Coder Agent 生成的代码进行测试和评估。

图片

Tester Agent 的工作原理如下:

  1. 1. 执行代码: 执行 Coder Agent 生成的代码。

  2. 2. 检查结果: 检查代码的执行结果是否符合预期。

  3. 3. 反馈错误: 如果发现错误,将错误信息反馈给 Coder Agent,以便其进行修正。

通过 Coder Agent 和 Tester Agent 的协同工作,Vision Agent 能够自动生成高质量的代码,并完成各种视觉任务。

以下是一些 Vision Agent 的应用示例:

  • • 检测图像中的人脸,并判断是否佩戴口罩:

图片

  • • 分析视频,识别交通事故:

图片

 

吴恩达的呼吁:拥抱 Agentic AI,共创智能未来

吴恩达认为,Agentic AI 的出现是人工智能领域的一场重大变革,它将从根本上改变我们与 AI 的交互方式,也将为人类社会带来巨大的价值。

他呼吁开发者积极拥抱 Agentic AI,探索其应用边界,共同推动 AI 技术的发展。同时,他也提醒人们关注 Agentic AI 可能带来的伦理和社会影响,例如算法偏见、隐私泄露等问题,并呼吁各界共同努力,确保 AI 技术安全可控地发展,为人类创造更加美好的未来。

参考资料

  • • Andrew Ng 在 2024 Snowflake 峰会开发者日上的演讲:https://www.youtube.com/watch?v=q1XFm21I-VQ

这篇关于吴恩达:从 Agent 到 Agentic,超越基础模型的下一代 AI的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1078171

相关文章

揭秘未来艺术:AI绘画工具全面介绍

📑前言 随着科技的飞速发展,人工智能(AI)已经逐渐渗透到我们生活的方方面面。在艺术创作领域,AI技术同样展现出了其独特的魅力。今天,我们就来一起探索这个神秘而引人入胜的领域,深入了解AI绘画工具的奥秘及其为艺术创作带来的革命性变革。 一、AI绘画工具的崛起 1.1 颠覆传统绘画模式 在过去,绘画是艺术家们通过手中的画笔,蘸取颜料,在画布上自由挥洒的创造性过程。然而,随着AI绘画工

RedHat运维-Linux文本操作基础-AWK进阶

你不用整理,跟着敲一遍,有个印象,然后把它保存到本地,以后要用再去看,如果有了新东西,你自个再添加。这是我参考牛客上的shell编程专项题,只不过换成了问答的方式而已。不用背,就算是我自己亲自敲,我现在好多也记不住。 1. 输出nowcoder.txt文件第5行的内容 2. 输出nowcoder.txt文件第6行的内容 3. 输出nowcoder.txt文件第7行的内容 4. 输出nowcode

一份LLM资源清单围观技术大佬的日常;手把手教你在美国搭建「百万卡」AI数据中心;为啥大模型做不好简单的数学计算? | ShowMeAI日报

👀日报&周刊合集 | 🎡ShowMeAI官网 | 🧡 点赞关注评论拜托啦! 1. 为啥大模型做不好简单的数学计算?从大模型高考数学成绩不及格说起 司南评测体系 OpenCompass 选取 7 个大模型 (6 个开源模型+ GPT-4o),组织参与了 2024 年高考「新课标I卷」的语文、数学、英语考试,然后由经验丰富的判卷老师评判得分。 结果如上图所

Vim使用基础篇

本文内容大部分来自 vimtutor,自带的教程的总结。在终端输入vimtutor 即可进入教程。 先总结一下,然后再分别介绍正常模式,插入模式,和可视模式三种模式下的命令。 目录 看完以后的汇总 1.正常模式(Normal模式) 1.移动光标 2.删除 3.【:】输入符 4.撤销 5.替换 6.重复命令【. ; ,】 7.复制粘贴 8.缩进 2.插入模式 INSERT

AI儿童绘本创作

之前分享过AI儿童绘画的项目,但是主要问题是角色一致要花费很长的时间! 今天发现了这款,非常奈斯! 只需输入故事主题、风格、模板,软件就会自动创作故事内容,自动生成插画配图,自动根据模板生成成品,测试效果如下图。 变现方式:生成儿童绘本发布到各平台,吸引宝妈群体进私域。  百度网盘 请输入提取码百度网盘为您提供文件的网络备份、同步和分享服务。空间大、速度快、安全

零基础STM32单片机编程入门(一)初识STM32单片机

文章目录 一.概要二.单片机型号命名规则三.STM32F103系统架构四.STM32F103C8T6单片机启动流程五.STM32F103C8T6单片机主要外设资源六.编程过程中芯片数据手册的作用1.单片机外设资源情况2.STM32单片机内部框图3.STM32单片机管脚图4.STM32单片机每个管脚可配功能5.单片机功耗数据6.FALSH编程时间,擦写次数7.I/O高低电平电压表格8.外设接口

大语言模型(LLMs)能够进行推理和规划吗?

大语言模型(LLMs),基本上是经过强化训练的 n-gram 模型,它们在网络规模的语言语料库(实际上,可以说是我们文明的知识库)上进行了训练,展现出了一种超乎预期的语言行为,引发了我们的广泛关注。从训练和操作的角度来看,LLMs 可以被认为是一种巨大的、非真实的记忆库,相当于为我们所有人提供了一个外部的系统 1(见图 1)。然而,它们表面上的多功能性让许多研究者好奇,这些模型是否也能在通常需要系

ps基础入门

1.基础      1.1新建文件      1.2创建指定形状      1.4移动工具          1.41移动画布中的任意元素          1.42移动画布          1.43修改画布大小          1.44修改图像大小      1.5框选工具      1.6矩形工具      1.7图层          1.71图层颜色修改          1

人工和AI大语言模型成本对比 ai语音模型

这里既有AI,又有生活大道理,无数渺小的思考填满了一生。 上一专题搭建了一套GMM-HMM系统,来识别连续0123456789的英文语音。 但若不是仅针对数字,而是所有普通词汇,可能达到十几万个词,解码过程将非常复杂,识别结果组合太多,识别结果不会理想。因此只有声学模型是完全不够的,需要引入语言模型来约束识别结果。让“今天天气很好”的概率高于“今天天汽很好”的概率,得到声学模型概率高,又符合表达

智能客服到个人助理,国内AI大模型如何改变我们的生活?

引言 随着人工智能(AI)技术的高速发展,AI大模型越来越多地出现在我们的日常生活和工作中。国内的AI大模型在过去几年里取得了显著的进展,不少独创的技术点和实际应用令人瞩目。 那么,国内的AI大模型有哪些独创的技术点?它们在实际应用中又有哪些出色表现呢?此外,普通人又该如何利用这些大模型提升工作和生活的质量和效率呢?本文将为你一一解析。 一、国内AI大模型的独创技术点 多模态学习 多