AI:我又又又打败了人类冠军!小学生:叫爸爸!

2023-11-22 04:50

本文主要是介绍AI:我又又又打败了人类冠军!小学生:叫爸爸!,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

看到“双节”期间中国有5.5亿人出行的新闻,我不由得虎躯一震。想到了人会多,但没想到会这么多!看来大家都充满了探索欲,希望在难得的假期去往自己熟悉或未知的地方。

就算你选择了“家里蹲”,也一定会通过网上冲浪、阅读游戏等方式,来探索自己的内心世界。

探索是人类的本能,从婴儿时期开始,好奇心就驱动着我们去探索并理解自己所在的世界, AI的成长则离不开对人类的观察与模仿,其中,就包括探索的能力。

这种能力被算法掌握之后,出现了阿尔法狗打败人类棋圣,也出现了OpenAIFive——在电子游戏领域完虐人类玩家。不过即便如此,人类的探索能力依然令最高级的AI都望尘莫及。

比如婴儿可以从爬行和探索中学会认知三维空间,而一些计算机视觉还总被曝出被平面照片所欺骗过去的新闻,上马更高性能的3D视觉算法则需要耗费巨大的算力资源,从这个角度看,人脑无疑在效果和效率上都碾压了AI。

那么,能不能引入儿童的学习能力,来实现更聪明的AI呢?这个猜测,就像是“把爱因斯坦的大脑给我我也能拿诺贝尔奖”一样,是一个有点铁憨憨,又有点重要的问题。

5岁小孩碾压AI,“玩”就够了

大家不妨在假期做一个生活观察,看看小孩子们是如何探索世界的?

如果一个玩具看起来有很多玩法,但他们不知道哪一个是正确的,小孩子们会进行假设驱动的探索,如果“假设”失败了,他们就会转向新的玩具。

有研究显示,一个11个月大的婴儿,在看到许多违反物理定律的现象时,会忍不住对其进行更多的探索,甚至会做出一些违规行为来实践自己的假设。

比如看到一辆漂浮在空中的汽车,有点颠覆以往的认知了,你会怎么做?婴儿会选择将玩具砰地扔到桌子上,想知道这种“不合常理”的情况是怎么出现的(所以阻止熊孩子弄坏你手办的唯一办法,就是根本不要让他们看到它们)。

这种“不见黄河心不死”式的自由探索,有时会令家长和大人们不堪其扰,但抽象化的“假设”能够让人类做出大量预测,想象出许多新的可能性,不仅是一种极为有意义的学习方式,更是人类创造力的由来。

不过就像小王子觉得枯燥的大人们看不到“蟒蛇肚子里的大象”一样,令人遗憾的是,这种探索能力是幼儿的专长,大部分情况下只存在在5岁以前,这也让他们成为宇宙中最好的学习者。

既然儿童行为如此有参考意义,科学家们自然也想得到。事实上,儿童发展学对AI的进展起到了重要的方向牵引作用。

科学家们曾将好奇心引入神经网络,打造了深度增强学习,通过奖励反馈来鼓励智能体(agent)主动探索和理解环境,更新模型参数。这让AI能够自主获得技能,在电子游戏等需要通用智能的复杂场景中能够做出自己的决策,而不是人类预先通过庞大的标注数据集给定答案。

其他类型的儿童行为亦有价值。前面提到的“不见黄河心不死”的探索,就被化作深度优先搜索策略,DeepMind和加州大学伯克利分校的研究人员,开发了一个3D导航和解谜环境。智能体(agent)沿着特定路径进行探索,如果遇到死胡同,那就回去找到下一条没有探索过的道路,继续前进。

听起来是不是很像小孩子走迷宫的游戏?这能让智能体接触到各种各样的经验,在信息较少的环境中工作;减少对数据量的依存,改变目前算力资源紧张的局面,让许多小数据、少样本的领域(如金融、医疗)也能实现智能化。

将儿童探索行为应用于AI,一切都能变得更好,理想层面上确实如此,但现实总喜欢跟科学家们开玩笑,也算是给人类保留了一个“杀手锏”吧。

AI能力暴涨的当下,

人类为什么还能稳坐智慧王座?

需要注意的是,这些类似儿童探索的策略,通常更多被用在训练期间提高代理人的经验值,而不是在决策时支持快速学习和探索。用人话说就是“懂得了许多道理,却不一定能过好这一生”,因为一到关键选择时刻就会掉链子。

就拿前面提到的深度优先搜索(DFS)来说,科学家们发现,如果让孩子们自由探索,那么他们与智能体按DFS做出的行动有90%的相似,而以目标为导向(找到橡皮糖)来探索的话,有96%的路线都是相似的。但不同的是,探索越多的孩子,最后能花费更少的时间完成任务,智能体却相反。

如果智能体发现一个地方很有趣(能得到奖励),就会一直重新访问该区域,直到它终于终于终于觉得那里不再有趣了,这会导致其概括性不佳(无法形成最佳策略)。

其中的差别就在于,孩子不是被动地孤立学习或由目标驱动,而是在不断实验和收集信息,将自己的认知和经验与获得的信息结合起来,编织出一个丰富的世界模型。而即使最复杂的机器探索方法,也只能为特定的目标服务,一时半会还无法完美匹配这个充满了各种“意外”的真实世界。

为什么有了一定的探索能力,AI智能体的表现还是不尽如人意呢?

首当其冲就是实验室与现实环境的巨大不同。

深度强化学习过去都是“机上谈兵”,不是跟人类在二维游戏里PK,就是数字网格里下棋,而儿童的探索则是发生在信息丰富的三维现实世界之中,许多潜在因素很难被应用到实验中。

这也是为什么,当今最强大的AI智能机器人也达不到一个仅小学毕业的优秀人类服务员的工作能力,能像他们一样快速适应环境、完成各种复杂任务。

此外,儿童的发展心理学研究很难在AI产业链中形成“闭环”。要真正激发AI生长出服务现实的能力,不仅要构建出具有更强探索能力的智能体,还要继续学习人类的认知能力,推进人工智能自身的理论创新和软硬件升级(比如搭建三维训练环境),这一系列链式突破,才能最终将技术构想转化为现实生产力。“大力出奇迹”的深度学习,其高光时刻就是这么来的。

沿着这个方向,我们可以进一步了解,怎样才能弥合智能体与人类之间的差距。

下一代AI,逐渐浮出迷雾的真实未来

在过去的数年里,深度学习做到了传统算法所无法企及的进度,催生了大量的工业界应用,但其实,现在的深度学习还是很傻——举个例子,大部分人都可以通过几十个小时的学习学会开小汽车,而完全自动的L5级无人汽车至今还是个遥远的梦。

图灵奖得主Geoffrey Hinton就一直非常渴望找到一种新的实现深度网络的方法,认为目前(最广泛的反向传播算法)根本不是大脑的工作机制。

另一位图灵奖得主Yann Lecun,就认为在某些游戏中,需要大量增加模型训练时间才能达到或超过专业人类玩家的水平。

通过儿童的学习模式,发现当前最优秀的AI也比不上5岁小孩的智力,或许我们可以回答“下一代AI应该是什么样”,这个神经网络最重要的未解难题之一。

至少要有两重升级:

1.有意识。目前公认文字表达能力最高、模型最为庞大的GPT-3也曾被专家吐槽是“无脑作业”,其实并不真正理解自己写出的句子。而具有自主探索、决策、推理能力的AI,可以理解自己周围的环境,才是真正的人工智能。

2.能效比。为什么即使存在缺陷,依然没有妨碍深度学习带领AI进来发展热潮呢?核心原因就在于深度神经网络大幅度降低了全社会处理、挖掘、应用大数据的成本。相对人脑而言,现有的计算硬件功耗都很高,不断提升AI性价比,是避免再次陷入寒冬的唯一方法,也在呼唤更高级的算法。

这两个基本难题,只能交给科学家和工程师们在针尖上做大文章了。对于我们普通人来说,保有一颗如儿童般对世界的好奇心,触碰充满各种信息的大自然,由此得来的系统认知与思维能力,或许才是机器永远无法企及,且弥足珍贵的。

这个假期,你们都有过哪些有趣的探索呢?快来评论区告诉我呀!

这篇关于AI:我又又又打败了人类冠军!小学生:叫爸爸!的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/407633

相关文章

Ilya-AI分享的他在OpenAI学习到的15个提示工程技巧

Ilya(不是本人,claude AI)在社交媒体上分享了他在OpenAI学习到的15个Prompt撰写技巧。 以下是详细的内容: 提示精确化:在编写提示时,力求表达清晰准确。清楚地阐述任务需求和概念定义至关重要。例:不用"分析文本",而用"判断这段话的情感倾向:积极、消极还是中性"。 快速迭代:善于快速连续调整提示。熟练的提示工程师能够灵活地进行多轮优化。例:从"总结文章"到"用

AI绘图怎么变现?想做点副业的小白必看!

在科技飞速发展的今天,AI绘图作为一种新兴技术,不仅改变了艺术创作的方式,也为创作者提供了多种变现途径。本文将详细探讨几种常见的AI绘图变现方式,帮助创作者更好地利用这一技术实现经济收益。 更多实操教程和AI绘画工具,可以扫描下方,免费获取 定制服务:个性化的创意商机 个性化定制 AI绘图技术能够根据用户需求生成个性化的头像、壁纸、插画等作品。例如,姓氏头像在电商平台上非常受欢迎,

从去中心化到智能化:Web3如何与AI共同塑造数字生态

在数字时代的演进中,Web3和人工智能(AI)正成为塑造未来互联网的两大核心力量。Web3的去中心化理念与AI的智能化技术,正相互交织,共同推动数字生态的变革。本文将探讨Web3与AI的融合如何改变数字世界,并展望这一新兴组合如何重塑我们的在线体验。 Web3的去中心化愿景 Web3代表了互联网的第三代发展,它基于去中心化的区块链技术,旨在创建一个开放、透明且用户主导的数字生态。不同于传统

AI一键生成 PPT

AI一键生成 PPT 操作步骤 作为一名打工人,是不是经常需要制作各种PPT来分享我的生活和想法。但是,你们知道,有时候灵感来了,时间却不够用了!😩直到我发现了Kimi AI——一个能够自动生成PPT的神奇助手!🌟 什么是Kimi? 一款月之暗面科技有限公司开发的AI办公工具,帮助用户快速生成高质量的演示文稿。 无论你是职场人士、学生还是教师,Kimi都能够为你的办公文

Andrej Karpathy最新采访:认知核心模型10亿参数就够了,AI会打破教育不公的僵局

夕小瑶科技说 原创  作者 | 海野 AI圈子的红人,AI大神Andrej Karpathy,曾是OpenAI联合创始人之一,特斯拉AI总监。上一次的动态是官宣创办一家名为 Eureka Labs 的人工智能+教育公司 ,宣布将长期致力于AI原生教育。 近日,Andrej Karpathy接受了No Priors(投资博客)的采访,与硅谷知名投资人 Sara Guo 和 Elad G

AI hospital 论文Idea

一、Benchmarking Large Language Models on Communicative Medical Coaching: A Dataset and a Novel System论文地址含代码 大多数现有模型和工具主要迎合以患者为中心的服务。这项工作深入探讨了LLMs在提高医疗专业人员的沟通能力。目标是构建一个模拟实践环境,人类医生(即医学学习者)可以在其中与患者代理进行医学

AI行业应用(不定期更新)

ChatPDF 可以让你上传一个 PDF 文件,然后针对这个 PDF 进行小结和提问。你可以把各种各样你要研究的分析报告交给它,快速获取到想要知道的信息。https://www.chatpdf.com/

【北交大信息所AI-Max2】使用方法

BJTU信息所集群AI_MAX2使用方法 使用的前提是预约到相应的算力卡,拥有登录权限的账号密码,一般为导师组共用一个。 有浏览器、ssh工具就可以。 1.新建集群Terminal 浏览器登陆10.126.62.75 (如果是1集群把75改成66) 交互式开发 执行器选Terminal 密码随便设一个(需记住) 工作空间:私有数据、全部文件 加速器选GeForce_RTX_2080_Ti

AI Toolkit + H100 GPU,一小时内微调最新热门文生图模型 FLUX

上个月,FLUX 席卷了互联网,这并非没有原因。他们声称优于 DALLE 3、Ideogram 和 Stable Diffusion 3 等模型,而这一点已被证明是有依据的。随着越来越多的流行图像生成工具(如 Stable Diffusion Web UI Forge 和 ComyUI)开始支持这些模型,FLUX 在 Stable Diffusion 领域的扩展将会持续下去。 自 FLU

AI基础 L9 Local Search II 局部搜索

Local Beam search 对于当前的所有k个状态,生成它们的所有可能后继状态。 检查生成的后继状态中是否有任何状态是解决方案。 如果所有后继状态都不是解决方案,则从所有后继状态中选择k个最佳状态。 当达到预设的迭代次数或满足某个终止条件时,算法停止。 — Choose k successors randomly, biased towards good ones — Close