Google AI 系统 DeepMind 高中数学考试不及格

2023-10-18 21:59

本文主要是介绍Google AI 系统 DeepMind 高中数学考试不及格,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

Google 旗下 DeepMind 团队让 AI 系统接受一项高中程度的数学测试,结果在 40 道题目中只答对了 14 题,甚至连「1+1+1+1+1+1+1」也算错了。说来难以置信,Google AI 系统能打败人类世界棋王,却无法通过高中程度的数学考试。

cff71c46b36ee582b83abe76c89b768329f.jpg

(imgsource / pixabay)

上周,Google 旗下 DeepMind 团队公布了一份名为《分析神经模型的数学推理能力》的研究报告。在这项研究中,DeepMind 团队让 AI 系统接受一项涵括算术、几何、概率、测量和微积分的数学测试,考题有 40 题,难度大约是英国高中数学的程度。

结果 DeepMind 虽然在一些题目上表现不错,但是碰上文字、加减乘除符号、函数等组成的问题时,却因看不懂题目而无法作答。最后,在 40 道题目中,这个人工智能系统只答对 14 题,拿到「E」的分数,也就是说 —— 不及格。

其中有一道题目是「1+1+1+1+1+1+1」,连小学生都知道答案是 7,但 DeepMind 却答成了6。

研究人员解释,DeepMind 神经模型最长可以计算出现次数(n) 6 次以下的数值,但如果 n = 7,它就算不出来。当 AI 碰到同一数字出现多次,它会认为输入值是出错的。奇怪的是,碰上更长的加法题目,DeepMind 却算得出来。研究人员承认还找不出很好的解释,但很可能是因为 AI 神经网络不断观察每道问题,从而做出正确的解答。

此外,当研究人员要求 DeepMind 在一长串数字中找出「位值」(place value),它就能答得很好,因为它可以按数字大小排出顺序,也能将小数四舍五入。

研究人员说,人类智慧优于神经模型之处,在于对于事物复合式推论的能力。推论是一种复杂、多面向能力的展现。在解答问题时,人脑动用了多种认知能力,包括将符号分类(如区分数字、加减乘除符号、文字、变量)、规划(如找出正确顺序的函数)、演算、运用工作记忆来储存中间值、还要运用学到的规则或定理等。相反的,以卷积和递归神经网络发展出的 DeepMind 擅长模式比对、机器翻译和强化式学习,但弹性远不及人脑。它们不太能将事物推论到已有经验的环境外,更无法处理刻意乱输入的资讯。

目前 AI 或许当不成数学老师,但也已经相当厉害。DeepMind 公司的 AlphaGo 接连打败人类围棋冠军李世乭、柯洁。去年 12 月 DeepMind 的 AlphaZero 又在星海争霸 2(StarCraft II)测试赛中,以 5 比 0 打赢世界顶尖职业玩家。此外,自学画画、创作音乐也都难不倒 AI。

这篇关于Google AI 系统 DeepMind 高中数学考试不及格的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/235378

相关文章

Spring AI集成DeepSeek三步搞定Java智能应用的详细过程

《SpringAI集成DeepSeek三步搞定Java智能应用的详细过程》本文介绍了如何使用SpringAI集成DeepSeek,一个国内顶尖的多模态大模型,SpringAI提供了一套统一的接口,简... 目录DeepSeek 介绍Spring AI 是什么?Spring AI 的主要功能包括1、环境准备2

Spring AI集成DeepSeek实现流式输出的操作方法

《SpringAI集成DeepSeek实现流式输出的操作方法》本文介绍了如何在SpringBoot中使用Sse(Server-SentEvents)技术实现流式输出,后端使用SpringMVC中的S... 目录一、后端代码二、前端代码三、运行项目小天有话说题外话参考资料前面一篇文章我们实现了《Spring

Spring AI与DeepSeek实战一之快速打造智能对话应用

《SpringAI与DeepSeek实战一之快速打造智能对话应用》本文详细介绍了如何通过SpringAI框架集成DeepSeek大模型,实现普通对话和流式对话功能,步骤包括申请API-KEY、项目搭... 目录一、概述二、申请DeepSeek的API-KEY三、项目搭建3.1. 开发环境要求3.2. mav

Nginx配置系统服务&设置环境变量方式

《Nginx配置系统服务&设置环境变量方式》本文介绍了如何将Nginx配置为系统服务并设置环境变量,以便更方便地对Nginx进行操作,通过配置系统服务,可以使用系统命令来启动、停止或重新加载Nginx... 目录1.Nginx操作问题2.配置系统服android务3.设置环境变量总结1.Nginx操作问题

C#集成DeepSeek模型实现AI私有化的流程步骤(本地部署与API调用教程)

《C#集成DeepSeek模型实现AI私有化的流程步骤(本地部署与API调用教程)》本文主要介绍了C#集成DeepSeek模型实现AI私有化的方法,包括搭建基础环境,如安装Ollama和下载DeepS... 目录前言搭建基础环境1、安装 Ollama2、下载 DeepSeek R1 模型客户端 ChatBo

CSS3 最强二维布局系统之Grid 网格布局

《CSS3最强二维布局系统之Grid网格布局》CS3的Grid网格布局是目前最强的二维布局系统,可以同时对列和行进行处理,将网页划分成一个个网格,可以任意组合不同的网格,做出各种各样的布局,本文介... 深入学习 css3 目前最强大的布局系统 Grid 网格布局Grid 网格布局的基本认识Grid 网

Spring AI集成DeepSeek的详细步骤

《SpringAI集成DeepSeek的详细步骤》DeepSeek作为一款卓越的国产AI模型,越来越多的公司考虑在自己的应用中集成,对于Java应用来说,我们可以借助SpringAI集成DeepSe... 目录DeepSeek 介绍Spring AI 是什么?1、环境准备2、构建项目2.1、pom依赖2.2

Deepseek R1模型本地化部署+API接口调用详细教程(释放AI生产力)

《DeepseekR1模型本地化部署+API接口调用详细教程(释放AI生产力)》本文介绍了本地部署DeepSeekR1模型和通过API调用将其集成到VSCode中的过程,作者详细步骤展示了如何下载和... 目录前言一、deepseek R1模型与chatGPT o1系列模型对比二、本地部署步骤1.安装oll

在不同系统间迁移Python程序的方法与教程

《在不同系统间迁移Python程序的方法与教程》本文介绍了几种将Windows上编写的Python程序迁移到Linux服务器上的方法,包括使用虚拟环境和依赖冻结、容器化技术(如Docker)、使用An... 目录使用虚拟环境和依赖冻结1. 创建虚拟环境2. 冻结依赖使用容器化技术(如 docker)1. 创

Spring AI Alibaba接入大模型时的依赖问题小结

《SpringAIAlibaba接入大模型时的依赖问题小结》文章介绍了如何在pom.xml文件中配置SpringAIAlibaba依赖,并提供了一个示例pom.xml文件,同时,建议将Maven仓... 目录(一)pom.XML文件:(二)application.yml配置文件(一)pom.xml文件:首