GPT-3:是富人的游戏,还是未来的电力?

2023-11-04 23:10
文章标签 未来 游戏 电力 gpt 富人

本文主要是介绍GPT-3:是富人的游戏,还是未来的电力?,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

我们从没像今天这样,离AGI如此之近,又如此之远,就差临门一脚得距离,但问题是我们的脚要多坚硬多有力,而大门又有多坚固多厚实?
在这里插入图片描述

GPT-3:是富人的游戏,还是未来的电力?

人工智能将是未来核心生产力,这一观点在科技届几乎无人会反对。

因此创造一个类人甚至超人的AI产品迷人且充满了想象力,吸引着各个行业都在尝试使用AI来帮助产业向智能化转型,资本和创业者也在其中沉浮向前。

2020年6月,在训练约2000亿个单词、烧掉几千万美元后,史上最强大AI模型GPT-3一炮而红。写小说、编剧本、敲代码……GPT-3的无所不能吸引了全球数以万计的开发人员正在基于该平台开发,目前300多种应用程序在使用 GPT-3,每天生产 45 亿个字符。

随着其应用场景的不断扩大,GPT-3 真的能取代人类吗?

01、GPT-3到底有多厉害?

之所以笔者今天想聊聊这个看似遥不可及的底层技术,是因为最近看了一部电视剧《你好,安怡》。在剧中,安怡是一位来自2035年的AI机器人,与当前生活中不一样的是,目前技术下的智能机器人虽然能帮忙做一些任务,但似乎只能干一件事。医院里的智能导诊机器人不会写代码,送餐的机器人也写不了小说,它们更像是一个个工具而非智能体。

一个真正的AI机器人应该什么样呢?电视剧里的安怡似乎给出了方向,她拥有自己的独立意识,不仅能搞定家务、带孩子,还能通过修改程序帮助主人解决工作危机,甚至还想做这个家庭的女主人。

想让AI机器人能够像人一样交流,就要用优异的NLP(自然语言处理)能力。而今天探讨的主角GPT-3就是NLP领域的佼佼者,达到了万能选手一般的能力,也因此被人为是AI领域一个出人意料的进步。

本质上GPT-3 是一个语言模型,而语言是智慧的工具,人能成为万物之灵是能够借助语言去获得知识。如果AI掌握了语言,并且理解还能预测人类语言,那么拥有GPT-3语言的AI机器人就很有可能成为安怡这样的通才。

这里就不得不提一下GPT-3的背景,GPT-3是由人工智能组织OpenAI开发的语言。该组织成立于2015年成立,其联合创始人包括特斯拉CEO马斯克、著名孵化器 Y Combinator 前 CEO 山姆·奥特曼以及著名投资人彼得·蒂尔等。

值得一提的是,此前NLP(自然语言处理)并不是Open AI最为关注的领域,但自然语言处理方面成果是业内一直关注的重点。

2020年,美国查普曼大学的学生利用基于Transformer的GPT-3模型,创作了影片剧本《律师》,走红社交网络。

2021年,OpenAI又基于GPT-3发布了DALL·E这个连接文本与图像的神经网络,能通过自然语言操纵视觉概念,比如,你输入“一把牛油果造型的扶手椅”,它们就能通过图像合成出一系列的目标图像。

人们所惊叹的创造力,让GPT-3产生了巨大的商业价值。

越多越多的企业家、科研人员甚至艺术家都开始探索这个领域,对他们来说,GPT -3意味着一种新的工具的诞生。

ZeroCrater的创始人甚至在一篇博客文章中表示,GPT -3比他尝试过的任何AI语言系统都更加连贯。确实GPT-3 可扩展性非常强大,甚至可以用在无代码开发领域,只要对它输入你想要什么样的网页或者 app,它就能帮你直接生成。因此,之前业内也传出过基层码农将会被 AI干掉的言论。

从技术的角度,GPT-3是有史以来功能最强大的语言模型。从初代 GPT 到 GPT-3,算法模型基本没有变化,但通过堆人、堆算力来进行训练后的结果就是GPT-3有希望去胜任所有智力任务。

数据显示,GPT训练数据量从1代到目前的3代一直在高速增长,GPT-3的参数量已经达到1750亿,而算力费也已经是千万级别。

可见,GPT-3靠的是通过规模化现有算法模型,来实现算力的增长。回顾GPT-3 的技术思路,可以发现AI 领域的一个明显趋势是:要训练一个有颠覆性进步的模型,最终比拼的是算力规模。

02、算力,一场富人的游戏?

神经网络之父Geoffrey Hinton在GPT-3出现后,曾这样感慨:“生命、宇宙和万物的答案,其实只是4.398万亿个参数而已。”

算力是AI发展始终绕不开的问题。

罗氏、辉瑞、诺华、默沙东等等著名药企,都瞄准AI完成药物筛选,加速新药研发进程;谷歌的AI程序AlphaFold 2,去年成功解决了蛋白质折叠的问题,相当于突破了生物学50年的重大难题……这些科技成果背后离不开计算机的发展,计算机算力已经成为基础科研、前沿研究的重要工具。GPT-3的参数量已经达到千亿级别,规模接近人类神经元的总量,就是最好的例子。

但强大的算力往往靠的是财力的支持。其实GPT-3不仅训练成本高,此前微软还为训练它特地建设了一个5亿美元的超算中心。微软这个超算中心装载了一万张英伟达GPU,训练GPT-3消耗了它355个GPU年的算力。

因此算力带来的经济成本也成为了国内AI研发的壁垒。一方面,国内AI大厂拥有的软硬件虽然多,但是不够开放,闲置的算力资源被散落在各个平台。

中国拥有全球超算Top500中的226台

另一方面,中国很少有企业能够像微软一般财大气粗组件算力中心。因为即使是比GPT-3规模更小的AI模型,动辄耗费几十乃至上百张AI加速卡,对很多企业来说也是“不能承受之重”。

03、谁能打造国内的AI发电厂?

那么在中国,如果打造出一个比GPT-3更强,甚至像安怡一般超出想象力的人工智能呢?

目前看来市面上有两种路径可以走,一种是开发出更加强大的算法,更高效地利用算力,节省费用;另一种是就是在现有算法基础上进行规模化训练,让更多AI模型获得丰富的训练参数,从而达到优质模型的开放。但当下,走通两条路的前提都是拥有强大的算力。据估计,未来人工智能将占据80%以上的计算需求,需要有开放的AI算力中心承载这种需求。

还记得去年国家发改委明确划定“新基建”的概念范围时,指出“人工智能作为信息基础设施板块中的新技术基础设施,因其对传统产业的创新和重塑能力,更被誉为是数字经济时代的‘新电能’”。

因此当AI被誉为数字经济时代的“新电能”时,谁先搭建开放的算力中心,谁将成为国内的AI发电厂。

开源这件事,在过去的手机行业取得了巨大的成功,凭借软件开放、硬件整合的能力,普通消费者短短十年内享受到了智能手机普及的福利。

因此AI产业若能完成算力的软件与硬件的开源,就能让AI行业迅速发展。

因为开源可以高效统筹散落的闲置算力资源,达到提高算力的结果,从而低成本实现整个产业的共赢。

2011年,Facebook牵头发起了OCP开放计算项目,4年时间内OCP就为Facebook节省了20亿美元的成本,数据中心电费降低了20%。

还有英特尔、微软、谷歌都在以开放的姿态融合更多新的AI硬件,把更强大的算力贡献给产业。

反观国内,阿里拥有突出的云计算能力,为超过一半的A股上市公司、80%中国科技创新企业提供服务;商汤做为中国知名的AI算法提供商,已公开的全球专利资产近2000件,覆盖20个国家和地区;浪潮智算中心与5G结合,提供了云端训练、边缘推理的新应用场景……这些前言AI企业都能把算力供给全行业使用,就能推动AI的产业化,以国内庞大市场,也一定能催生更强大AI模型的诞生。

04、未来价值

知名风投机构 A16Z合伙人Frank Chen关于CPT-3的观点是,GPT-3让使用者避开了培训数据以及建立AI业务的部分经济成本,这使得NLP(自然语言处理)成为AI研发最有前途的领域之一。因为有了GPT-3,很多AI初创公司的软件都内置了最新的NLP技术。

这意味着,开放API的GPT-3已经对AI创业公司产生正向的影响。随着算力的开放,AI时代拥有更多低廉的算力资源,更多像GPT-3一样的AI模型就会低成本出现,从而推动AI的产业化。

但新兴的技术往往面临高速发展与低速商业化的困局,因此新旧技术之间的交替也非常考验资本与企业的耐心。但不能偏于一隅的仅仅讨论商业应用价值,因为它代表着未来的竞争力。

几十年前,柯达说,你负责按快门,剩下的交给我们。

在未来,AI 或许也会表明心态,人类什么都不用干,剩下的交给它。


http://www.taodudu.cc/news/show-8153281.html

相关文章:

  • 本周AI热点回顾:英伟达A100训练速度可达V100的3.5倍;飞桨框架支持ONNX协议​保存模型
  • 值得收藏 Modbus RTU 协议详解
  • 聊聊Blazor开发,是否值得去学
  • __iomem
  • ncnn2mem
  • Linux内核中__iomem的解析
  • BWA-MEM算法结构分析
  • uvm_mem 模型 (1)
  • mem_map 分析
  • dpdk/vpp中的memif使用方法
  • 【bioinfo】bwa mem 比对分值参数测试
  • LwIP 之五 详解内存堆(mem.c/h)动态内存管理策略
  • 基因数据处理7之BWA_MEM运行太长
  • AUTOSAR-MemIf模块
  • svt_mem的使用
  • Linux系统“/dev/mem”设备使用详解(Hi3520D)
  • __iomem解析
  • 关于uvm_mem model的使用
  • linux内存mem和swap,Linux内存 mem 和 swap
  • 格兰特·凯特林:西方家族财富管理注重早期规划
  • CRM财富管理
  • 区块链时代的财富代码——AngelToken
  • 互联网时代的财富分配问题
  • 公式整理(持续更新,至数学期望)_2021秋季《概率论与数理统计》
  • python3.6版本安装TensorFlow
  • 【Caffe】Caffe: Convolutional architecture for fast feature embedding
  • 已成长23年
  • php上传图片用年月日命名,thinkphp5中上传文件自定义命名规则
  • PAT成长之路——1074 宇宙无敌加法器(高精度加法)(20分)
  • @所有人 阿里云原生团队向你发出offer邀请,在线等!
  • 这篇关于GPT-3:是富人的游戏,还是未来的电力?的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



    http://www.chinasem.cn/article/345812

    相关文章

    JAVA智听未来一站式有声阅读平台听书系统小程序源码

    智听未来,一站式有声阅读平台听书系统 🌟 开篇:遇见未来,从“智听”开始 在这个快节奏的时代,你是否渴望在忙碌的间隙,找到一片属于自己的宁静角落?是否梦想着能随时随地,沉浸在知识的海洋,或是故事的奇幻世界里?今天,就让我带你一起探索“智听未来”——这一站式有声阅读平台听书系统,它正悄悄改变着我们的阅读方式,让未来触手可及! 📚 第一站:海量资源,应有尽有 走进“智听

    4B参数秒杀GPT-3.5:MiniCPM 3.0惊艳登场!

    ​ 面壁智能 在 AI 的世界里,总有那么几个时刻让人惊叹不已。面壁智能推出的 MiniCPM 3.0,这个仅有4B参数的"小钢炮",正在以惊人的实力挑战着 GPT-3.5 这个曾经的AI巨人。 MiniCPM 3.0 MiniCPM 3.0 MiniCPM 3.0 目前的主要功能有: 长上下文功能:原生支持 32k 上下文长度,性能完美。我们引入了

    国产游戏崛起:技术革新与文化自信的双重推动

    近年来,国产游戏行业发展迅猛,技术水平和作品质量均得到了显著提升。特别是以《黑神话:悟空》为代表的一系列优秀作品,成功打破了过去中国游戏市场以手游和网游为主的局限,向全球玩家展示了中国在单机游戏领域的实力与潜力。随着中国开发者在画面渲染、物理引擎、AI 技术和服务器架构等方面取得了显著进展,国产游戏正逐步赢得国际市场的认可。然而,面对全球游戏行业的激烈竞争,国产游戏技术依然面临诸多挑战,未来的

    GPT系列之:GPT-1,GPT-2,GPT-3详细解读

    一、GPT1 论文:Improving Language Understanding by Generative Pre-Training 链接:https://cdn.openai.com/research-covers/languageunsupervised/language_understanding_paper.pdf 启发点:生成loss和微调loss同时作用,让下游任务来适应预训

    火柴游戏java版

    代码 /*** 火柴游戏* <p>* <li>有24根火柴</li>* <li>组成 A + B = C 等式</li>* <li>总共有多少种适合方式?</li>* <br>* <h>分析:</h>* <li>除去"+"、"="四根,最多可用火柴根数20根。</li>* <li>全部用两根组合成"1",最大数值为1111。使用枚举法,A和B范围在0~1111,C为A+B。判断</li>** @

    国产游戏行业的崛起与挑战:技术创新引领未来

    国产游戏行业的崛起与挑战:技术创新引领未来 近年来,国产游戏行业蓬勃发展,技术水平不断提升,许多优秀作品在国际市场上崭露头角。从画面渲染到物理引擎,从AI技术到服务器架构,国产游戏已实现质的飞跃。然而,面对全球游戏市场的激烈竞争,国产游戏技术仍然面临诸多挑战。本文将探讨这些挑战,并展望未来的机遇,深入分析IT技术的创新将如何推动行业发展。 国产游戏技术现状 国产游戏在画面渲染、物理引擎、AI

    未来工作趋势:零工小程序在共享经济中的作用

    经济在不断发展的同时,科技也在飞速发展。零工经济作为一种新兴的工作模式,正在全球范围内迅速崛起。特别是在中国,随着数字经济的蓬勃发展和共享经济模式的深入推广,零工小程序在促进就业、提升资源利用效率方面显示出了巨大的潜力和价值。 一、零工经济的定义及现状 零工经济是指通过临时性、自由职业或项目制的工作形式,利用互联网平台快速匹配供需双方的新型经济模式。这种模式打破了传统全职工作的界限,为劳动

    第四次北漂----挣个独立游戏的素材钱

    第四次北漂,在智联招聘上,有个小公司主动和我联系。面试了下,决定入职了,osg/osgearth的。月薪两万一。 大跌眼镜的是,我入职后,第一天的工作内容就是接手他的工作,三天后他就离职了。 我之所以考虑入职,是因为 1,该公司有恒歌科技的freex平台源码,可以学学,对以前不懂的解解惑。 2,挣点素材钱,看看张亮002的视频,他用了6000多,在虚幻商城买的吸血鬼游戏相关的素材,可以玩两年。我

    文章解读与仿真程序复现思路——电力自动化设备EI\CSCD\北大核心《考虑燃料电池和电解槽虚拟惯量支撑的电力系统优化调度方法》

    本专栏栏目提供文章与程序复现思路,具体已有的论文与论文源程序可翻阅本博主免费的专栏栏目《论文与完整程序》 论文与完整源程序_电网论文源程序的博客-CSDN博客https://blog.csdn.net/liang674027206/category_12531414.html 电网论文源程序-CSDN博客电网论文源程序擅长文章解读,论文与完整源程序,等方面的知识,电网论文源程序关注python

    速通GPT-3:Language Models are Few-Shot Learners全文解读

    文章目录 论文实验总览1. 任务设置与测试策略2. 任务类别3. 关键实验结果4. 数据污染与实验局限性5. 总结与贡献 Abstract1. 概括2. 具体分析3. 摘要全文翻译4. 为什么不需要梯度更新或微调⭐ Introduction1. 概括2. 具体分析3. 进一步分析 Approach1. 概括2. 具体分析3. 进一步分析 Results1. 概括2. 具体分析2.1 语言模型