哈萨比斯的人类补完计划

2023-10-13 14:10

本文主要是介绍哈萨比斯的人类补完计划,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

在著名动漫《新世纪福音战士》里,碇源堂和他背后的SEELE组织始终在执行一项叫做“人类补完计划”的神秘行动。


这个计划到底是什么意思,粉丝们已经争吵了很多年。但大体上应该是说利用“神性”来补完人类族群,从而消除人类社会中的种种问题。也就是说,这个计划是“把人类补完的计划”。


但“人类补完”这个词,其实还可以有另一种解释,就是“用人类去补完某种东西的计划”。有东西需要用人类来补完吗?当然有,比如说人工智能。


号称AI研发实力地球第一的DeepMind,似乎就在执行着这样一个“计划”。我们知道,相比于大部分兴趣广泛的AI实验室型企业,DeepMind的专注点非常整齐。基本可以形容为:左手游戏,右手神经学;向下关注医疗落地,向上思考AI道德。


这样的方向选择,与DeepMind创始人哈萨比斯的个人经历与兴趣紧密相关。游戏我们已经看到了围棋和《星际争霸2》。还没有引发公众关注的,是这位天才右手中攥着的,学习人类大脑与神经来发展高等级人工智能的宏伟野心。



有野心不可怕,可怕的是,在不到一年的时间里,这个计划已经初现规模。


“狂人”的战役


大概地球上不会有第二个人,能够同时擅长人工智能、游戏、神经科学、创业这四件事。


关于“神童”哈萨比斯的事迹,媒体已经有了太多报道。比如他5岁参加国际象棋正式比赛,16岁进入剑桥学习人工智能,22岁创办了电脑游戏公司,以及后面DeepMind的系列“神迹”。


但媒体比较少关注的一件事,是这个被万维网之父蒂姆·伯纳斯·李称为“星球上最聪明的人之一”的人工智能专家,博士学位修的是认知神经科学。


2005年,已经沉浸人工智能多时的哈萨比斯,决定回到象牙塔中充电。在伦敦大学学院攻读神经学中,哈萨比斯发现了大脑海马体与人类情景记忆的关系。这固然是个关于人类记忆的重要发现,但要注意的是,其同时也影响了接下来很长一段时间内关于机器记忆的研究,尤其是在机器学习中的连续学习和长期学习。


其实在上世纪四五十年代,研究机器智能的专家,很多来自于神经科学与社会行为学。毕竟所谓人工智能,归根结底目标是让机器产生类似人类智慧的能力。但随着后来人工智能与计算机科学的联系日间紧密,神经科学也回到了生物学的研究序列中。


几十年间二者各自飞速发展,研究人员也越来越“专业”。直到统计学和数学开始笼罩AI研究,人工智能的底层研究似乎很大程度上变成了纯碎的函数问题。


显然,据说5岁就开始思考人工智能问题的哈萨比斯,对这种现象是非常不满的。DeepMind成立初期,始终在忙着让AI打游戏和完成棋类运动。而在2017年,AlphaGo终于无敌于天下,哈萨比斯却没怎么享受胜利果实,而是马不停蹄开始了一项长期计划的号召:人工智能必须继续向神经科学取经。



去年7月,哈萨比斯非常少见的亲手写下长篇文章,并且不是像往常一样发表在人工智能刊物,而是发表在了神经医学界的最高规格刊物《神经》中。


这篇《神经科学启发人工智能》,完全可以看做是一篇檄文。文中哈萨比斯开宗明义地表示,假如我们的目标是开发出接近或同等于人类智慧的智能技术,那么就绝不能放弃对人脑的研究和理解,因为人脑是唯一能够证明这种智慧存在的证据。同时他还历数了强化学习、迁移学习等10个神经科学可以启发AI研究的领域。


在哈萨比斯看来,今天学术界的过于封闭,已经限制了AI研究的发展。目前神经科学对人工智能的影响,更多来自于微妙的启发和科研成果借鉴,缺乏AI与神经科学的系统性结合,缺乏双向人才(比如哈萨比斯自己),更缺少两个领域有效、直接的沟通。所以他呼吁培养跨领域人才,希望建立共同的理论体系、话语机制和跨学科研究项目。


当然了,只呼喊不实干从来不是DeepMind与哈萨比斯的风格(事实上很少见到哈萨比斯如此努力呼吁某事)。在几个月时间里,DeepMind的科学家们已经浩浩荡荡把BOSS“学习神经科学”的主张实践了起来。


“科学狂人”这场“用人类补完AI”的战役,此刻已在高速运转中。


用成长心理学解释AI黑箱


去年6月,似乎为了与哈萨比斯的呼吁相配合,DeepMind团队发表了一篇论文,探讨用心理学中的某些现象和实验方法来解释AI的黑箱子问题。


我们知道,黑箱现象如今是困扰人类探索AI的主要问题之一。在经过复杂的神经网络计算之后,常常会出现人类无法搞懂算法的运作机制,不知道算法如何得出结论的问题。失控的机器智能当然不是好智能,但研究AI的判断与喜好却总是缺乏有效途径。



DeepMind的科学家们,想到了去心理学取经。心理学中有个专门学科,叫做成长心理学,研究幼儿成长过程中产生的心理、认知与记忆变化。这门学科中有个有意思的实验,是研究幼儿究竟是怎么记住兔子的?


告诉孩子什么是兔子,再重新找一只兔子让他识别,他记住的是什么呢?是颜色?形状?还是局部特征?最终心理学实验表明,人类幼儿总是偏向于通过形状来记忆新事物。


从中受到启发,DeepMind对AI模型进行了类似的实验,首先让模型记住一个物体,然后一面调整物体的颜色,一面调整物体的形状。最终结果表明,深度学习网络也与人类有相似的偏好:更喜欢根据形状来识别对象。



这种偏好是此前的AI研究中没有发现的,虽然它不能完全解释黑箱,但却给理解AI开启了全新的思路。更重要的是,类似的心理学研究与实验还有太多。也就意味着给AI做心理实验是有效而价值巨大的。


换句话说,这项研究成果表示,哈萨比斯希望在今天用神经科学补强AI,似乎有门!


用强化学习理解人类大脑


在哈萨比斯看来,不仅AI需要向神经科学学习,对人类大脑与神经的研究,在今天也需要向AI学习。


强化学习,是今天AI前沿研究中最火热的议题之一。这门技术希望用强化信号,来反复向智能体输出奖励机制,从而让神经网络不断做出优化选择,建立最优决策机制。AlphaGo Zero就强调用强化学习来快速达成高度成熟的围棋能力。


在9月和10月的两项研究中,DeepMind开启了全新脑洞:用强化学习机制来理解人类大脑。


比如在《自然》子刊《自然·人类行为》上发表的一篇论文中,DeepMind联合多院校的相关团队,一起探讨了人类决策行为时的后继表示(successor representation,SR)现象。实验结果显示,人类决策行为中,确实用到了缓存未来预期并映射到现实决策中的方案。这也是强化学习模式在人脑中工作的第一个证据。


另一篇发表在《自然神经科学》的论文中,DeepMind尝试用强化学习技术来探究人脑中海马体的工作方式。大脑中海马体能够作为空间定位器,负责帮人类认路,这已经是公认的事实。但是这样的解释却无法说明海马体是如何参与记忆、决策、推理等任务的。


DeepMind还是基于AI中强化学习技术的思路,设计了相关实验,来证明海马体的定位和指路能力,其实是一种有奖励机制和决策机制的强化学习过程。


相关证据表明,大脑海马体在指路中的作用,是建立在空间信息之上,对奖励最大化的选择。研究人员称其为“地图预测机制”。这也就解释了海马体参与其他人脑工作时的基本方式。



这两篇研究最有脑洞的地方在于:他们都是用强化学习机制来解释人脑的运作模式,并通过一些实验来证明自己的解释是正确的。同时又反过来阐释,假如人脑确实是以强化学习中的奖励机制来执行预测、记忆等基本智能。那么对人类大脑机制的研究与模仿,应该也可以加强对强化学习技术的理解和升级。


在同一个实验中,两个学科相互帮助携手进步,真的有点奇妙…


用心智理论,帮助机器理解彼此


如果说以上“用人类补完AI”的计划还停留在学术认识上,那么到了今年,DeepMind似乎已经准备好在AI技术本身放大招了。


就在上个月,DeepMind发表了他们如何让智能体理解智能体的研究“机器心智理论”(Machine Theory of Mind),并放出了相关模型。这毫无疑问意味着人类对AI可解释性的研究到了新的阶段。同时这也是我认为本文可以开始写作的原因之一。


什么是“心智理论”?


我们认为AI处于黑箱子中难以理解,但我们是怎么理解其他人类的呢?我们可以跟其他人交流,预测他人的行动和情感,甚至可以预测他人的消费行为...但我们没有把他们的大脑撬开,看里面的前额叶海马体脑皮层是如何工作的...原因就在于,我们是通过心智理解他人和自己的行为与情感。这就是心理学上的心智理论。


DeepMind希望利用这个心理学概念,让智能体观察和学习其他智能体的动作与行为,从而准确预测被观察者下一步的动作。通过不同等级智能体的观察实验,论文中已经展示出ToMnet理解并预测不同层级、不同底层技术智能体的能力。



换句话说,这项技术突破让AI成功的通过外部行动来理解AI,而不必将内在架构链接在一起。


事情到了这里,已经弥漫出一点失控的味道。假如未来机器可以像人类一样,通过交谈和行为理解彼此,那与人类好像也没多大不同了。


根据最近各方面的反馈看,机器心智理论(Theory of Mind neural network)——ToMnet的价值,很有可能不低于历史上任何一项人工智能技术突破。虽然有专家批评ToMnet并非是建立在知识空白的基础上去理解其他智能体,但这项技术突破的价值还是被广泛承认。


很多专家预测,接下来多智能体协同系统,机器交互,AI自我成长,这些关键领域很可能都要以ToMnet作为基础。


而这个突破的根源,却是来自心理学。


战鼓初鸣:关于补完计划的进度


让我们来总结一下哈萨比斯这场“用神经科学强化AI”行动的进度吧。


目前DeepMind相关研究专注于两个方面:强化学习、AI可解释性。整体研究围绕这两项技术来展开,既用心理学和神经科学来加强对AI黑箱的破解,同时也希望用强化学习等“AI原理”帮助探秘人类大脑。


整个计划的最大成绩,在于给跨学科研究做出了扎实的示范,证明了用神经学补全AI的可行性。非常关键的机器心智理论很可能带来惊喜,成为主流研究方向。而对于强化学习的探索,可能与机器决策、物理世界处理等AI领域的技术相结合。


还有一点值得注意,DeepMind开源了Psychlab平台。这是一个“智能体专用心理测试集”,可以让更多研究者尝试AI与心理学的结合。



整个计划也不是没有问题。比如哈萨比斯一度呼吁搭建双学科理论框架和标准学术话语,今天依旧未见踪影。由于没有带来极其惊人的大动作,大众对于这类技术所知也不多。此外,虽然哈萨比斯曾经怀疑过这一现象,但直到今天,神经科学与认知心理学对AI的影响依旧主要是启发性的,缺乏前沿技术成果的相互关照。


而放眼未来,与记忆相关的AI技术或许会成为DeepMind的研究重点。情景记忆、工作记忆、长期学习等技术很有可能成为突破方向。


最重要的是,2018年,我们很大概率会看到哈萨比斯在AI模仿人类神经与心智上搞个轰动社会舆论的“大动作”出来。



还有一个问题,哈萨比斯和DeepMind如此坚定地推动AI向神经科学学习,终极目的仅仅是为了强化AI技术吗?


在去年《神经》杂志上那篇形同宣言的文章中,哈萨比斯曾在结尾处畅想:通过人工智能来了解人类智慧,让人工智能与人类大脑形成比对,或许有可能“对人类心灵中一些最深刻和最持久的奥秘产生深刻的见解,例如创造力、梦想,甚至有一天能触及意识的本质。”


真至于此,是不是同样喜欢戴黑框眼镜的哈萨比斯和碇源堂,两个人的“人类补完计划”,也就没有什么不同了?


-----------------分页符-----------------


这篇关于哈萨比斯的人类补完计划的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/203770

相关文章

Oracle数据库执行计划的查看与分析技巧

《Oracle数据库执行计划的查看与分析技巧》在Oracle数据库中,执行计划能够帮助我们深入了解SQL语句在数据库内部的执行细节,进而优化查询性能、提升系统效率,执行计划是Oracle数据库优化器为... 目录一、什么是执行计划二、查看执行计划的方法(一)使用 EXPLAIN PLAN 命令(二)通过 S

《计算机视觉工程师养成计划》 ·数字图像处理·数字图像处理特征·概述~

1 定义         从哲学角度看:特征是从事物当中抽象出来用于区别其他类别事物的属性集合,图像特征则是从图像中抽取出来用于区别其他类别图像的属性集合。         从获取方式看:图像特征是通过对图像进行测量或借助算法计算得到的一组表达特性集合的向量。 2 认识         有些特征是视觉直观感受到的自然特征,例如亮度、边缘轮廓、纹理、色彩等。         有些特征需要通

Claude Enterprise推出计划

每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领域的领跑者。点击订阅,与未来同行! 订阅:https://rengongzhineng.io/ 今天推出的Claude Enterprise计划,专为企业打造安全的

为备份驱动器制定备份计划:维护数据的3大方法

时间:2014-02-26 14:49 来源:网管之家 字体:[大 中 小]   您可能已经对您的电脑进行了备份,但其实这样还是远远不够的,其并非如您所认为的那样安全。您企业备份驱动器上的文件可能与您的主系统上的文件一样,容易受到灾难的影响。根据最近流行的恶意软件CryptoLocker的感染途径显示,连接到PC的外置驱动器——辅助硬盘驱动器,例如,用于备份的外部USB硬盘驱动器,可以像

基于开源链动 2 + 1 模式、AI 智能名片与 S2B2C 商城小程序的用户忠诚度计划

摘要:本文深入探讨了在商业环境中执行用户忠诚度计划的创新途径。通过整合开源链动 2 + 1 模式、AI 智能名片以及 S2B2C 商城小程序等先进元素,从提供福利、解决问题和创造赚钱机会三个核心方面展开详细阐述。研究表明,这些新技术和新模式的有机结合,能够为企业打造更具吸引力和影响力的用户忠诚度计划,从而实现商业效益的最大化与可持续发展。 一、引言 在当今竞争激烈且市场环境快速变化的时代,

[置顶] 2014训练计划进阶版

动态规划: 区间dp,树状dp,数位dphdu3555, sgu258, sgu390  队列优化: zoj3399 最小表示法的状态压缩DP: spoj2159  专题链接:http://acm.hust.edu.cn/vjudge/contest/view.action?cid=38881#overview 专题链接: http://acm.hust.edu.cn/vjudg

[置顶] 2014训练计划

每个专题结束后会有5小时的专题赛~ 1、hustOJ目前支持谷歌、火狐浏览器等部分浏览器。 2、欢迎吐槽~ 3、推荐该阶段用书(以下具体算法实现多数可在此书中找到详解):算法竞赛入门经典之训练指南(刘汝佳) 4、题解报告:专题中的题目多是经典题目,百度搜索即有详细解答~ 5、专题相关知识点红字标出,建议先百度红字部分,有助于专题学习~ 6、专题时间会在"ACM 今天你AC了吗?"(12

Windows 一键定时自动化任务神器 zTasker,支持语音报时+多项定时计划执行

简介 zTasker(详情请戳 官网)是一款完全免费支持定时、热键或条件触发的方式执行多种自动化任务的小工具,支持win7-11。其支持超过100种任务类型,50+种定时/条件执行方法,而且任务列表可以随意编辑、排列、移动、更改类型,支持任务执行日志,可覆盖win自带的热键,同时支持任务列表等数据的备份及自动更新等。 简言之,比微软系统自带的任务计划要强好几倍,至少灵活性高多了,能大幅提高电脑使

【Oracle篇】全面理解优化器和SQL语句的解析步骤(含执行计划的详细分析和四种查看方式)(第二篇,总共七篇)

💫《博主介绍》:✨又是一天没白过,我是奈斯,DBA一名✨ 💫《擅长领域》:✌️擅长Oracle、MySQL、SQLserver、阿里云AnalyticDB for MySQL(分布式数据仓库)、Linux,也在扩展大数据方向的知识面✌️ 💖💖💖大佬们都喜欢静静的看文章,并且也会默默的点赞收藏加关注💖💖💖 SQL优化续新篇,第二篇章启幕时。 优化器内藏奥秘,解析SQL步

2019学习计划

工作三年了,第一年感觉是荒废的,第二年开始学习python,第三年开始自动化 感觉自己会的东西比较少,而且不够深入,流于表面 现制定一下今年大概的学习计划 需持续巩固加强:python、ui自动化、接口自动化、sql等 代码量需提升,敲的不够(重点) 学习: 1.移动端测试,appium等 2.前端知识系统整理学习  3.性能测试 4.docker入门,环境搭建 5.shell