『大模型笔记』AGI的定义之争:人工智能的终极目标还有多远?

2024-03-22 11:28

本文主要是介绍『大模型笔记』AGI的定义之争:人工智能的终极目标还有多远?,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

AGI的定义之争:人工智能的终极目标还有多远?

文章目录

  • 一. 关于通用人工智能本质的争论
  • 二. 参考文献

一. 关于通用人工智能本质的争论

  • “通用人工智能”(AGI) 一词在当前的AI话题讨论中已经变得极为普遍。OpenAI宣布其宗旨为 “确保通用人工智能能够惠及所有人类。” DeepMind的公司愿景声明强调,“通用人工智能…可能会引领历史上最伟大的变革之一。” AGI这一概念在英国政府的国家AI战略及美国政府的AI文档中频繁出现。微软的研究员们最近宣称,在大型语言模型GPT-4中,他们发现了通用人工智能的初现迹象,而现任及前任的谷歌高层也宣布,“通用人工智能已经成为现实。”埃隆·马斯克因为质疑GPT-4是否能被归类为一种“通用人工智能算法”,而将OpenAI告上法庭,这成为了一桩引人注目的诉讼案件。
  • 早期AGI的倡导者曾认为,机器不久将全面接管人类的各种活动。然而,研究人员通过一些失败教训发现,开发能在国际象棋上战胜你或解答你的搜索问题的AI系统,远比造出一个能折叠衣物或修理水管的机器人来得简单。因此,AGI的定义随之调整,仅限于所谓的“认知任务”。DeepMind的联合创始人Demis Hassabis认为,AGI应该是一个“能够完成几乎所有人类能够进行的认知任务的系统”而OpenAI则将其描述为“在大多数经济价值较高的工作中胜过人类的高度自主系统”,这里的“大多数”排除了那些需要物理智能的任务,这种智能可能还需要一段时间才能在机器人身上实现。
  • AI的“智能”概念——无论是认知上的还是其他方面的——常常被框定为个体智能体优化奖励或目标的过程。有影响力的论文之一将通用智能定义为“智能体在广泛环境下实现目标的能力”;另一篇论文则指出,“智能及其相关能力,可以被理解为服务于奖励最大化的过程。”确实,这就是当代AI的工作原理——比如,计算机程序AlphaGo被训练来优化特定的奖励函数(“赢得比赛”),而GPT-4则被训练来优化另一种奖励函数(“预测句子中的下一个词”)。
  • 这种关于智能的观点导致了一些AI研究人员的另一种推测:一旦AI系统实现了AGI,它将通过对其自身软件的优化,递归式地提高自己的智能,很快就能获得超人类智能,按照一种极端的预测,“其智能将比我们高出数千甚至数百万倍”。
  • 这种对优化的关注使得AI社区中的一些人开始担忧,那些可能会以疯狂的方式背离其创造者目标的“未对齐”AGI对人类的存在构成的风险。在他2014年的书《超级智能》中,哲学家Nick Bostrom提出了一个著名的思想实验:他设想人类给予一个超级智能AI系统一个目标——优化回形针的生产。AI系统将这一目标字面化到极致,使用其非凡的才智控制地球上的所有资源,并将一切转化为回形针。显然,人类并不希望为了生产更多的回形针而导致地球和人类的毁灭,但他们忘记在指令中明确这一点。AI研究员Yoshua Bengio提出了他自己的思想实验:“我们可能请求AI解决气候变化问题,它可能会设计出一种病毒来大幅减少人类人口,因为我们的指示对于‘伤害’的定义不够清晰,而且实际上人类是解决气候危机的主要障碍。”
  • 这些对AGI(和“超级智能”)的推测性看法,与那些研究生物智能,尤其是人类认知的人所持的观点不同。尽管认知科学没有对“通用智能”给出严格定义,也没有就人类或任何类型的系统能在多大程度上具备这种智能达成共识,但大多数认知科学家都会同意,智能不是可以在单一尺度上测量并随意调整的量,而是一种复杂的、在特定进化利基中大体上是适应性的,由普遍能力和专门能力综合而成的特质。
  • 许多研究生物智能的学者对于是否能将所谓的“认知”智能方面从其它模式中分离并实现在无形体的机器中进行模拟持有怀疑态度。心理学家们已经证明,人类智能的重要组成部分根植于个体的身体和情感的亲身体验中。同时,证据表明个体的智能深刻依赖于其参与社会和文化环境的程度。与其他人理解、协调并从中学习的能力,对于个人达成目标的成功来说,往往比个人的“优化能力”更为重要。此外,不同于理论上以最大化纸夹产出为目标的AI,人类智能的核心并非围绕着固定目标的优化,而是通过内在需求与其智能得到社会及文化环境支持的复杂整合来形成个人目标。与那些旨在超级智能地最大化纸夹产出的假想AI不同,智能的增强恰恰使我们能够更准确地理解他人的意图以及我们自己行为可能产生的影响,并据此调整我们的行为。正如哲学家Katja Grace所述,“将征服宇宙视为达成几乎任何人类目标的一个步骤,几乎对任何人来说都是完全荒谬的。那么,我们为什么会认为AI的目标会有所不同呢?”
  • 机器通过提升自身软件来实现智能的量级增长,这一设想同生物学上对智能的理解大相径庭,后者认为智能是一个超越了孤立大脑的高度复杂系统。如果达到人类水平的智能需要不同认知能力的复杂整合,以及社会和文化的支撑,那么系统的“智能”层面很可能无法无缝访问到“软件”层面,正如我们人类无法轻易通过工程化手段改造大脑(或基因)来提升自己的智力一样。然而,作为一个整体,我们通过外部技术工具,比如计算机,以及建立文化机构,比如学校、图书馆和互联网,提高了我们的实际智能水平。
  • AGI的含义以及它是否构成一个连贯的概念仍然是一个讨论话题。此外,对AGI机器能够做什么的猜测,大多基于直觉而非科学证据。但这些直觉有多可靠呢?AI的历史一再证明我们对于智能的直觉是错误的。许多早期的AI先锋认为,通过逻辑编程的机器能够捕获人类智能的全谱。其他学者预测,让机器在下棋中击败人类、在语言之间翻译或进行对话,需要它具备一般人类水平的智能——这些预测都被证明是错误的。在AI发展的每一个阶段,人类水平的智能都比研究者预期的要复杂得多。当前对于机器智能的推测会不会同样错误呢?我们能否发展出一个更加严谨和通用的智能科学来回答这些问题?
  • 目前还不清楚,AI科学会更类似于人类智能的科学,还是更像是天体生物学——后者对其他星球上可能存在的生命形式进行预测。对于那些从未见过、可能甚至不存在的事物(无论是外星生命还是超智能机器)进行预测,将需要基于一般原则的理论。最终,“AGI”的意义和后果不会由媒体辩论、诉讼或我们的直觉和猜测来确定,而是通过长期的科学研究来探索这些原则。

二. 参考文献

  • https://www.science.org/doi/10.1126/science.ado7069?continueFlag=882766b3b828657a17cf1da2cf50cf2e

这篇关于『大模型笔记』AGI的定义之争:人工智能的终极目标还有多远?的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/835207

相关文章

Tolua使用笔记(上)

目录   1.准备工作 2.运行例子 01.HelloWorld:在C#中,创建和销毁Lua虚拟机 和 简单调用。 02.ScriptsFromFile:在C#中,对一个lua文件的执行调用 03.CallLuaFunction:在C#中,对lua函数的操作 04.AccessingLuaVariables:在C#中,对lua变量的操作 05.LuaCoroutine:在Lua中,

AssetBundle学习笔记

AssetBundle是unity自定义的资源格式,通过调用引擎的资源打包接口对资源进行打包成.assetbundle格式的资源包。本文介绍了AssetBundle的生成,使用,加载,卸载以及Unity资源更新的一个基本步骤。 目录 1.定义: 2.AssetBundle的生成: 1)设置AssetBundle包的属性——通过编辑器界面 补充:分组策略 2)调用引擎接口API

一份LLM资源清单围观技术大佬的日常;手把手教你在美国搭建「百万卡」AI数据中心;为啥大模型做不好简单的数学计算? | ShowMeAI日报

👀日报&周刊合集 | 🎡ShowMeAI官网 | 🧡 点赞关注评论拜托啦! 1. 为啥大模型做不好简单的数学计算?从大模型高考数学成绩不及格说起 司南评测体系 OpenCompass 选取 7 个大模型 (6 个开源模型+ GPT-4o),组织参与了 2024 年高考「新课标I卷」的语文、数学、英语考试,然后由经验丰富的判卷老师评判得分。 结果如上图所

《offer来了》第二章学习笔记

1.集合 Java四种集合:List、Queue、Set和Map 1.1.List:可重复 有序的Collection ArrayList: 基于数组实现,增删慢,查询快,线程不安全 Vector: 基于数组实现,增删慢,查询快,线程安全 LinkedList: 基于双向链实现,增删快,查询慢,线程不安全 1.2.Queue:队列 ArrayBlockingQueue:

大语言模型(LLMs)能够进行推理和规划吗?

大语言模型(LLMs),基本上是经过强化训练的 n-gram 模型,它们在网络规模的语言语料库(实际上,可以说是我们文明的知识库)上进行了训练,展现出了一种超乎预期的语言行为,引发了我们的广泛关注。从训练和操作的角度来看,LLMs 可以被认为是一种巨大的、非真实的记忆库,相当于为我们所有人提供了一个外部的系统 1(见图 1)。然而,它们表面上的多功能性让许多研究者好奇,这些模型是否也能在通常需要系

人工智能机器学习算法总结神经网络算法(前向及反向传播)

1.定义,意义和优缺点 定义: 神经网络算法是一种模仿人类大脑神经元之间连接方式的机器学习算法。通过多层神经元的组合和激活函数的非线性转换,神经网络能够学习数据的特征和模式,实现对复杂数据的建模和预测。(我们可以借助人类的神经元模型来更好的帮助我们理解该算法的本质,不过这里需要说明的是,虽然名字是神经网络,并且结构等等也是借鉴了神经网络,但其原型以及算法本质上还和生物层面的神经网络运行原理存在

通俗范畴论4 范畴的定义

注:由于CSDN无法显示本文章源文件的公式,因此部分下标、字母花体、箭头表示可能会不正常,请读者谅解 范畴的正式定义 上一节我们在没有引入范畴这个数学概念的情况下,直接体验了一个“苹果1”范畴,建立了一个对范畴的直观。本节我们正式学习范畴的定义和基本性质。 一个范畴(Category) C𝐶,由以下部分组成: 数据: 对象(Objects):包含若干个对象(Objects),这些

操作系统实训复习笔记(1)

目录 Linux vi/vim编辑器(简单) (1)vi/vim基本用法。 (2)vi/vim基础操作。 进程基础操作(简单) (1)fork()函数。 写文件系统函数(中等) ​编辑 (1)C语言读取文件。 (2)C语言写入文件。 1、write()函数。  读文件系统函数(简单) (1)read()函数。 作者本人的操作系统实训复习笔记 Linux

人工和AI大语言模型成本对比 ai语音模型

这里既有AI,又有生活大道理,无数渺小的思考填满了一生。 上一专题搭建了一套GMM-HMM系统,来识别连续0123456789的英文语音。 但若不是仅针对数字,而是所有普通词汇,可能达到十几万个词,解码过程将非常复杂,识别结果组合太多,识别结果不会理想。因此只有声学模型是完全不够的,需要引入语言模型来约束识别结果。让“今天天气很好”的概率高于“今天天汽很好”的概率,得到声学模型概率高,又符合表达

智能客服到个人助理,国内AI大模型如何改变我们的生活?

引言 随着人工智能(AI)技术的高速发展,AI大模型越来越多地出现在我们的日常生活和工作中。国内的AI大模型在过去几年里取得了显著的进展,不少独创的技术点和实际应用令人瞩目。 那么,国内的AI大模型有哪些独创的技术点?它们在实际应用中又有哪些出色表现呢?此外,普通人又该如何利用这些大模型提升工作和生活的质量和效率呢?本文将为你一一解析。 一、国内AI大模型的独创技术点 多模态学习 多