进击的OpenAI,自研芯片背后的AI棋局

2024-01-04 15:59

本文主要是介绍进击的OpenAI,自研芯片背后的AI棋局,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

图片|Photo by Levart Photographer on unsplash

©自象限原创

作者|周游

编辑|程心

OpenAI又让整个大模型界炸开了锅。

10月5日消息,据路透社报道,OpenAI正在探索制造自己的人工智能芯片,并已开始评估潜在的收购目标。据统计,OpenAI至少投资了3家芯片公司,其中Cerebras(Jasper是其客户)更是一家美国芯片初创公司。

据「自象限」通过OpenAI官网的几则招聘信息中发现,目前,OpenAI已经开始招聘硬件工程师,用于评估和共同设计人工智能硬件。

▲图源:OpenAI官网

原本自研芯片并不是什么新鲜事,国内外Meta、微软、亚马逊、谷歌、阿里、腾讯等云厂商,无论是出于自身降本增效的需求,还是为了摆脱芯片公司(英伟达)的掣肘,自研AI芯片都已成为一种主流趋势。

但OpenAI的消息一出,依然引起了一片哗然。

不仅因为OpenAI是目前全球大模型的引领者,更是因为他的角色特殊、行事前瞻、代表了生成式AI的下一站。

OpenAI自研芯片,被行业认为其I迈向独立的第一步。一是独立供给,减少硬件投入成本,同时不让英伟达GPU产能不足等客观因素拖住其技术发展和商业化布局的后腿;二是微软自研AI芯片计划将于下个月推出,此时OpenAI选择保持自研,也是进一步独立于微软的信号。

自研芯片的背后,OpenAI独立的野心也在慢慢彰显,另一场新戏正被缓缓拉开序幕。

左手告别英伟达、右手告别微软

至少从去年开始,OpenAI就已经在讨论如何应对GPU短缺、昂贵的问题,也就是说,ChatGPT火爆之前,OpenAI的GPU就已经不够用了。

Altman 认为,获得更多芯片的努力与两大问题有关:为 OpenAI 软件提供动力的先进处理器短缺,以及为其工作和产品提供动力所需的硬件运行成本 "令人瞠目"。

本质上,由于GPU的短缺,导致了两个核心问题:显而易见的是训练和运营成本高昂,更重要的原因在于,软件技术的发展依赖于硬件技术,GPU短缺,成了OpenAI想要再迈进一个台阶的拦路虎。

成本方面,据过往报道,2020年开始,OpenAI一直在一台超级计算机上开发其人工智能技术,使用了1万块英伟达GPU,这个体量单是运营成本对OpenAI来说就十分昂贵。

据分析师分析,用户每次查询大约需要 4 美分,如果 ChatGPT 的查询量增长到谷歌搜索规模的十分之一,那么最初将需要价值约 481 亿美元的 GPU,并且每年需要价值约 160 亿美元的芯片来维持运行。另一位分析师估计,ChatGPT的运营成本高达每天70万美元。

但更重要的是,GPU的短缺已经严重影响了OpenAI的研发速度,Altman表示,由于OpenAI 无法获得足够GPU,这延误了 OpenAI 的短期计划,并给使用 OpenAI 服务的开发者带来了问题。

Altman列举了因为缺乏芯片而无法完成的几件事,包括其中包括为其 GPT 大型语言模型的大多数客户提供更长的 "上下文窗口"。上下文窗口决定了输入模型的单次提示可以使用多少数据,以及模型的响应时间有多长。GPT-4 的大多数用户的上下文窗口长度为 8000 个标记(标记是底层人工智能模型进行预测的一段数据,大约相当于一个半英语单词)。

人工智能专家哈比卜在其博文中透露道:OpenAI在今年3月宣布为该模型的部分用户提供3.2万个令牌的窗口,但很少有用户获准使用该功能,Altman将此归咎于GPU的缺乏。

OpenAI联合创始人兼职科学家Andrej Karpathy也在近日发文,表示GPT4可能在大约1万-2万五千张A100上进行训练,而根据马斯克的推测,GPT-5可能需要3万-5万个H100才可以完成。

只半年,英伟达的出货量就已经开始供不应求,受到产能和原材料的限制,英伟达目前在严格控制H100的买家,但OpenAI不能因此停下脚步。

想要打破这样的僵局,OpenIAI需要在一定程度上和英伟达解绑,但设计和制造芯片也并非一朝一夕之事,有业内人士推测OpenAI可能需要至少5年时间,且需要花费大量的时间成本、资金成本,同时专业人才和材料也会越来越紧缺,对于OpenAI自研芯片的成功与否,目前仍是一个问号。

在这个背景下,OpenAI明明有另一条路可以走:即放弃自研,采用微软即将推出的自研芯片:Althena(雅典娜)。据maginative消息称,微软首款自研芯片计划在下个月推出,具体时间很可能会定在11月14日微软西雅图Ignite大会上。

此前,OpenAI和微软曾共同测试该款AI芯片的性能,Althena对标英伟达H100,早在2019年就着手,且已经在芯片研发上砸入近20亿美元。

▲图源:微软官网

以微软和OpenAI人尽皆知的“恋爱关系”,OpenAI此时大可不必选择自研这条“又苦又累还有可能没结果”的事情。

而这也是OpenAI想摆脱微软的一个关键信号。事实上,微软和OpenAI的关系早就变的极其微妙,像极了一对“能共苦不能同甘”的情侣。

有知情人士曾向媒体爆料,微软已经指示研究人员建造更小更便宜的替代品,以取代OpenAI的GPT模型,因为微软越来越担心像ChatGPT这样的昂贵模型的成本飙升。

同时OpenAI也利用时间窗口率先选择客户。GPT4刚刚推出时,OpenAI并没有及时开放给微软,而是独家对外拿下了Snapchat等大客户后,才在Azure中上线。

这样微妙的关系,随着自研芯片,Altman摆脱英伟达、摆脱微软的野心,也彻底藏不住了。

做AI界的iPhone

如果说摆脱微软和英伟达是OpenAI的当务之急,那么如何像intel引领PC时代一样,持续引领AI浪潮的发展,并在一直在其中扮演关键角色,就成了OpenAI更长远的考虑。

这种长远考虑,可能与AI智能硬件有关。

在OpenAI被爆料计划自研AI芯片之前,金融时报就曾报道,OpenAI正在与前苹果设计师Jony lve一起和孙正义进行谈判,试图从软银获得超10亿美元的投资来打造“人工智能iPhone”。

这也为OpenAI自研AI芯片提供了另一个必须的理由。毕竟一直以来,消费级产品的发展都和芯片息息相关。

一个典型的例子是PC互联网时代著名的“安迪比尔定理”,该定理以因特尔前CEO安迪·格鲁夫和微软前CEO比尔·盖茨代指芯片和软件系统的关系,称“安迪给多少,比尔拿走多少”。在移动互联网时代,芯片也成为智能手机的核心竞争力,高通骁龙系列、苹果的A系列芯片都成为支撑智能手机的发展底层动力。

但当AI时代到来,之前用于智能终端的CPU却并不完全适用于AI终端,因为AI需要大量的并行计算并不是CPU能满足的,所以AI设备的处理器必然需要以GPU为主的新计算单元。

OpenAI显然想要通过自研AI设备和芯片,来在AI时代实现像wintel联盟在PC时代一样的掌控力。

▲图源:intel官网

但要实现这个目标却并不容易,因为这意味着OpenAI不仅在要大模型领域保持优势,还要同时与苹果、三星等终端厂商,以及高通、英伟达等芯片企业竞争。

因此OpenAI现在并没有亲自下场自研终端设备的打算,而是依靠Jony lve的企业来完成这一战略目标。

作为前苹果公司首席设计官,Jony lve曾在苹果工作20多年,在苹果拥有仅次于乔布斯的影响力,也被乔布斯视为“在苹果的精神伙伴”。他曾参与iPod、iMac、iPhone、iPad等众多苹果产品的设计,在20世纪90年代,帮助苹果从濒临死亡中重新崛起。

与Jony lve的合作,能够一定程度解决OpenAI在AI硬件上的焦虑,但Sam Altman显然也并不打算将赌注全部押在Jony lve身上。

今年三月份,Sam Altman参与了一家新的智能设备企业Humane的C轮融资。该企业由Jony lve在苹果的前同事Imran Chaudhri于2018年创办。

Chaudhri比Jony lve早两年从苹果离职,而同样作为设计师,Chaudhri也在苹果服务超过20年。如今,他创办的企业Humane推出的产品只有不到智能手机一半的大小,依靠AI语音交互和激光投影进行显示,被称为“下一代智能设备”。

今年3月份,Humane完成了 1 亿美元 C 轮融资,其股东除了OpenAI的CEO Sam Altman之外,还包括SK Networks、微软和LG等国际巨头。

目前,Humane已与OpenAI 达成合作,将其技术集成到 Humane 设备中,向消费者大规模提供 OpenAI 和 Humane AI 的服务。

▲图源:Humane在TED上的展示

毫无疑问,每一个新时代的开启都伴随着一个新的终端。

比如互联网时代的个人电脑,移动互联网时代的智能手机,而且目前大模型进入智能终端已经成为一种既定的趋势。在国内,华为、小米等手机厂商已经将自家的大模型与智能手机相结合;在国外,苹果也在积极布局人工智能技术,其研发经费为此已比上一财年多出31.2亿美元。

但这些尝试仍然是在智能手机基础上对AI进行兼容,并不能算是完全的AI原生(AI Native)。

事实上,要实现真正的AI原生并不容易,除了前面提到的AI芯片之外,还需要AI原生的交互形式、全新需求场景、全新的产品设计和工业设计等等所以这条路仍然漫长而艰难,到目前为止,行业仍然没有标准答案,大家仍在苦苦摸索。

但如果抛开行业,其实在许多科幻电影/电视剧中,我们已经想象过下一代智能终端的样子,比如钢铁侠中的贾维斯,流浪地球中的MOSS,亦或者西部世界中通过语音交互的电脑等等。

9月底,OpenAI为ChatGPT加入了语音和图像交互的功能,许多人测试ChatGPT的语音能力,发现它的语音对话几乎已经与真人无异。比如有网友让ChatGPT扮演渣女,ChatGPT就会用“夹子音”进行沟通,在一个“我和你妈同时掉进河里”的问答中,ChatGPT不仅会回避问题,对话中还会加入“呃...”这样的语气词和口误,以达到和真人最大可能得相似。

从这样的体验来看,至少在语音交互上,ChatGPT已经越来越接近我们在电影中的想象。

而这也意味着,下一代智能设备的种子,已经开始发芽,而OpenAI开发下一代智能终端的时间也越来越紧迫。

结语

回过头来,AI时代的大幕拉开,OpenAI其实并没有绝对优势,如今已经是一场各显神通的混战。

我们之前讨论过英伟达,他也有称霸AI时代的野心,开始推进业务从芯片到云服务的扩张。除此之外,还有抢先布局应用生态的微软;破釜沉舟率先开源的Meta等等。

ChatGPT如同一声发令枪响,所有人都在争先恐后,从自己的战略眼光出发,卡位关键节点,向AI时代的王座攀登。但最后谁能坐上AI时代的铁王座,还需要时间来证明。

这篇关于进击的OpenAI,自研芯片背后的AI棋局的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/569839

相关文章

Ubuntu系统怎么安装Warp? 新一代AI 终端神器安装使用方法

《Ubuntu系统怎么安装Warp?新一代AI终端神器安装使用方法》Warp是一款使用Rust开发的现代化AI终端工具,该怎么再Ubuntu系统中安装使用呢?下面我们就来看看详细教程... Warp Terminal 是一款使用 Rust 开发的现代化「AI 终端」工具。最初它只支持 MACOS,但在 20

Ilya-AI分享的他在OpenAI学习到的15个提示工程技巧

Ilya(不是本人,claude AI)在社交媒体上分享了他在OpenAI学习到的15个Prompt撰写技巧。 以下是详细的内容: 提示精确化:在编写提示时,力求表达清晰准确。清楚地阐述任务需求和概念定义至关重要。例:不用"分析文本",而用"判断这段话的情感倾向:积极、消极还是中性"。 快速迭代:善于快速连续调整提示。熟练的提示工程师能够灵活地进行多轮优化。例:从"总结文章"到"用

AI绘图怎么变现?想做点副业的小白必看!

在科技飞速发展的今天,AI绘图作为一种新兴技术,不仅改变了艺术创作的方式,也为创作者提供了多种变现途径。本文将详细探讨几种常见的AI绘图变现方式,帮助创作者更好地利用这一技术实现经济收益。 更多实操教程和AI绘画工具,可以扫描下方,免费获取 定制服务:个性化的创意商机 个性化定制 AI绘图技术能够根据用户需求生成个性化的头像、壁纸、插画等作品。例如,姓氏头像在电商平台上非常受欢迎,

从去中心化到智能化:Web3如何与AI共同塑造数字生态

在数字时代的演进中,Web3和人工智能(AI)正成为塑造未来互联网的两大核心力量。Web3的去中心化理念与AI的智能化技术,正相互交织,共同推动数字生态的变革。本文将探讨Web3与AI的融合如何改变数字世界,并展望这一新兴组合如何重塑我们的在线体验。 Web3的去中心化愿景 Web3代表了互联网的第三代发展,它基于去中心化的区块链技术,旨在创建一个开放、透明且用户主导的数字生态。不同于传统

AI一键生成 PPT

AI一键生成 PPT 操作步骤 作为一名打工人,是不是经常需要制作各种PPT来分享我的生活和想法。但是,你们知道,有时候灵感来了,时间却不够用了!😩直到我发现了Kimi AI——一个能够自动生成PPT的神奇助手!🌟 什么是Kimi? 一款月之暗面科技有限公司开发的AI办公工具,帮助用户快速生成高质量的演示文稿。 无论你是职场人士、学生还是教师,Kimi都能够为你的办公文

Andrej Karpathy最新采访:认知核心模型10亿参数就够了,AI会打破教育不公的僵局

夕小瑶科技说 原创  作者 | 海野 AI圈子的红人,AI大神Andrej Karpathy,曾是OpenAI联合创始人之一,特斯拉AI总监。上一次的动态是官宣创办一家名为 Eureka Labs 的人工智能+教育公司 ,宣布将长期致力于AI原生教育。 近日,Andrej Karpathy接受了No Priors(投资博客)的采访,与硅谷知名投资人 Sara Guo 和 Elad G

AI hospital 论文Idea

一、Benchmarking Large Language Models on Communicative Medical Coaching: A Dataset and a Novel System论文地址含代码 大多数现有模型和工具主要迎合以患者为中心的服务。这项工作深入探讨了LLMs在提高医疗专业人员的沟通能力。目标是构建一个模拟实践环境,人类医生(即医学学习者)可以在其中与患者代理进行医学

AI行业应用(不定期更新)

ChatPDF 可以让你上传一个 PDF 文件,然后针对这个 PDF 进行小结和提问。你可以把各种各样你要研究的分析报告交给它,快速获取到想要知道的信息。https://www.chatpdf.com/

【北交大信息所AI-Max2】使用方法

BJTU信息所集群AI_MAX2使用方法 使用的前提是预约到相应的算力卡,拥有登录权限的账号密码,一般为导师组共用一个。 有浏览器、ssh工具就可以。 1.新建集群Terminal 浏览器登陆10.126.62.75 (如果是1集群把75改成66) 交互式开发 执行器选Terminal 密码随便设一个(需记住) 工作空间:私有数据、全部文件 加速器选GeForce_RTX_2080_Ti

AI Toolkit + H100 GPU,一小时内微调最新热门文生图模型 FLUX

上个月,FLUX 席卷了互联网,这并非没有原因。他们声称优于 DALLE 3、Ideogram 和 Stable Diffusion 3 等模型,而这一点已被证明是有依据的。随着越来越多的流行图像生成工具(如 Stable Diffusion Web UI Forge 和 ComyUI)开始支持这些模型,FLUX 在 Stable Diffusion 领域的扩展将会持续下去。 自 FLU