联想CTO芮勇:大模型的下一步是智能体丨数字思考者50人

2024-04-27 21:28

本文主要是介绍联想CTO芮勇:大模型的下一步是智能体丨数字思考者50人,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

ITValue

aa6c0dad5f90ce3a05879e76bf8128eb.png

钛媒体特别专题策划《数字思考者50人》:探访中国深刻的数字化思考者群体。我们理解的“TechThinker”,涵盖了中国数字化浪潮中的技术践行者、政策制定者与投资决策者。在这场长达10年的乘风破浪中,每个人都在分享技术进步的果实,却鲜有人知道结果背后的故事。我们期待通过《数字思考者50人》,还原中国数字化推进过程中的关键决策,同时也为你呈现数字思考者们在这个技术大变革时代对未来的展望和判断。

本期嘉宾:芮勇博士 联想集团首席技术官、高级副总裁

首发|钛媒体APP

  ITValue

01

大模型能力令人惊艳,但局限性有待改进

大模型的出现可以说是AI历史上一个重要的里程碑,它开启了人工智能发展的新纪元,在过去的16个月里,由大模型引领的人工智能技术日新月异,模型参数从百亿到迁移,再到万亿;模型类型从语言模型到视频模型,再到音乐模型,涵盖了生活工作的方方面面。

我认为,AI历史发展至今,没有任何一个技术可以像今天的大模型一样强大。

5705ff9113c6b90455c3db8962f6e4fa.jpeg

但是,当我们觉得大模型要“一统天下”的时候,它的局限性也逐步显现出来。例如,小学时我们就学过的“鸡兔同笼”的数学问题,如果直接提问给大模型,即使它做对了,人们也不知道大模型是真正理解了问题,还是仅仅是记住了训练的数据。

通过这个例子可以看出,今天的大模型没有真正理解语言,没有真正理解世界,也没有真正具备推理和规划的能力。现在的大模型仅仅是根据高维语义空间和联合概率分布,将它训练的数据中的海量片段进行简单的逻辑性的连接。而这种状态下的大模型虽然很强大,但局限性也很强。

要想突破这种局限性,我们不能再单纯地利用大数据+大算力+大网络的方式,堆砌大模型,而是要超越大模型,探索更接近人类思维方式和行为方式的人工智能。 

02

大模型的下一步是智能体

基于上述观点,我认为,大模型发展的下一步是:基于大模型的智能体。大模型的优势与缺点都很明显,优势是具备强大的能力,缺点是局限性很强。

基于此,我们要“扬长长短”。“扬长”是要持续发挥并不断增强大模型的能力;“长短”是要打造基于大模型的智能体技术,真正能解决应用场景中遇见的问题。而这也是联想的发展理念,左手抓大模型,右手抓智能体,两手都要抓,两手都要硬。

262cb3dfec3085b64c6ee04a3846c0b7.jpeg

在“左手”——增强大模型方面,从技术角度出发。增强大模型方面有四个混合技术方向:

首先,小模型不会消失。未来一定是基于大模型和小模型混合的“意图理解”技术。信息论里熵entropy是度量信息量的单位,越有序,熵越小,越无序,熵越大。使用交叉熵cross entropy损失最小化原则,将意图理解任务最优地分配给大模型和小模型,从而兼顾精准度和复杂性。

第二,未来一定是基于CPU、GPU、NPU混合调度的异构计算的天下。如今,大模型的训练和推理过程中,瓶颈往往不在于芯片算力,而在于数据传输。通过同时优化计算负载和数据传输的方式,使总体执行时间缩短。

第三,基于模型微调(SFT) 与检索增强(RAG) 混合的“智能问答”技术是最佳选择。模型微调(SFT) 与检索增强(RAG) 各有利弊,通过协同优化的方式,让模型微调(SFT) 与检索增强(RAG) 相向而行,从而达到最优结果。

第四,基于硬件加密与全栈可信架构的混合“隐私安全”技术。在安全领域,仅靠硬件不够,仅靠软件业不够,尤其是在后量子时代,通过在高维实数空间里进行因式分解进行加密将成为未来安全的重要趋势。

而这四类混合技术就需要云边端的协同,需要软硬件的协同,需要传输与计算的协同。

3b371e476db10a51716c33517bbf210b.jpeg

在“右手”——智能体方面,如何打造智能体是我们面临的问题。虽然大模型不是万能的,但是没有大模型是万万不能的。未来,大模型将占据“C位”,作为整体的控制中枢,但仅依靠大模型又远远不够。

怎么做呢?首先,要让智能体具有知道自身能力边界的能力,就好像人一样(人也是一个智能体),每个人都知道自身能力的边界。例如,你问我“茴”字如何写?我能告诉你,草字头,下面是个“回”。因为这个在我能力边界内。但如果问我“茴”的四种写法,这就超过了我得能力边界,我会通过查字典,上网查询等方式,查找答案。

回到大模型领域,不具备认知自身能力边界的能力,就使得大模型有时候会非常自信地告诉人们错误答案。

除了自我认知的能力,一个完整的智能体还要具备包括主动感知,意图理解,复杂任务分解,以及长短期记忆机制等在内的多种能力。

综上,大模型的下一步是智能体,智能体基于大模型而又超越大模型。


*温馨提示:喜欢ITValue公众号的小伙伴注意啦!根据公众号推送新规,请将ITValue设为“星标”,这样才能第一时间收到推送消息,已设置的小伙伴还需要重新设置“星标”

我知道你在看哦

73f4fec80937d1a5c7cef20efb7ffce4.gif

这篇关于联想CTO芮勇:大模型的下一步是智能体丨数字思考者50人的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/941575

相关文章

Python3脚本实现Excel与TXT的智能转换

《Python3脚本实现Excel与TXT的智能转换》在数据处理的日常工作中,我们经常需要将Excel中的结构化数据转换为其他格式,本文将使用Python3实现Excel与TXT的智能转换,需要的可以... 目录场景应用:为什么需要这种转换技术解析:代码实现详解核心代码展示改进点说明实战演练:从Excel到

0基础租个硬件玩deepseek,蓝耘元生代智算云|本地部署DeepSeek R1模型的操作流程

《0基础租个硬件玩deepseek,蓝耘元生代智算云|本地部署DeepSeekR1模型的操作流程》DeepSeekR1模型凭借其强大的自然语言处理能力,在未来具有广阔的应用前景,有望在多个领域发... 目录0基础租个硬件玩deepseek,蓝耘元生代智算云|本地部署DeepSeek R1模型,3步搞定一个应

Deepseek R1模型本地化部署+API接口调用详细教程(释放AI生产力)

《DeepseekR1模型本地化部署+API接口调用详细教程(释放AI生产力)》本文介绍了本地部署DeepSeekR1模型和通过API调用将其集成到VSCode中的过程,作者详细步骤展示了如何下载和... 目录前言一、deepseek R1模型与chatGPT o1系列模型对比二、本地部署步骤1.安装oll

Spring AI Alibaba接入大模型时的依赖问题小结

《SpringAIAlibaba接入大模型时的依赖问题小结》文章介绍了如何在pom.xml文件中配置SpringAIAlibaba依赖,并提供了一个示例pom.xml文件,同时,建议将Maven仓... 目录(一)pom.XML文件:(二)application.yml配置文件(一)pom.xml文件:首

Java数字转换工具类NumberUtil的使用

《Java数字转换工具类NumberUtil的使用》NumberUtil是一个功能强大的Java工具类,用于处理数字的各种操作,包括数值运算、格式化、随机数生成和数值判断,下面就来介绍一下Number... 目录一、NumberUtil类概述二、主要功能介绍1. 数值运算2. 格式化3. 数值判断4. 随机

如何在本地部署 DeepSeek Janus Pro 文生图大模型

《如何在本地部署DeepSeekJanusPro文生图大模型》DeepSeekJanusPro模型在本地成功部署,支持图片理解和文生图功能,通过Gradio界面进行交互,展示了其强大的多模态处... 目录什么是 Janus Pro1. 安装 conda2. 创建 python 虚拟环境3. 克隆 janus

本地私有化部署DeepSeek模型的详细教程

《本地私有化部署DeepSeek模型的详细教程》DeepSeek模型是一种强大的语言模型,本地私有化部署可以让用户在自己的环境中安全、高效地使用该模型,避免数据传输到外部带来的安全风险,同时也能根据自... 目录一、引言二、环境准备(一)硬件要求(二)软件要求(三)创建虚拟环境三、安装依赖库四、获取 Dee

DeepSeek模型本地部署的详细教程

《DeepSeek模型本地部署的详细教程》DeepSeek作为一款开源且性能强大的大语言模型,提供了灵活的本地部署方案,让用户能够在本地环境中高效运行模型,同时保护数据隐私,在本地成功部署DeepSe... 目录一、环境准备(一)硬件需求(二)软件依赖二、安装Ollama三、下载并部署DeepSeek模型选

Golang的CSP模型简介(最新推荐)

《Golang的CSP模型简介(最新推荐)》Golang采用了CSP(CommunicatingSequentialProcesses,通信顺序进程)并发模型,通过goroutine和channe... 目录前言一、介绍1. 什么是 CSP 模型2. Goroutine3. Channel4. Channe

Python基于火山引擎豆包大模型搭建QQ机器人详细教程(2024年最新)

《Python基于火山引擎豆包大模型搭建QQ机器人详细教程(2024年最新)》:本文主要介绍Python基于火山引擎豆包大模型搭建QQ机器人详细的相关资料,包括开通模型、配置APIKEY鉴权和SD... 目录豆包大模型概述开通模型付费安装 SDK 环境配置 API KEY 鉴权Ark 模型接口Prompt