老黄自己卷自己!GPU要一年更新一代!预告新动作:AI工厂将吞噬一切

2024-06-03 20:52

本文主要是介绍老黄自己卷自己!GPU要一年更新一代!预告新动作:AI工厂将吞噬一切,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

站在 AI 时代风口浪尖的弄潮儿英伟达又为大家带来了一场科技饕餮盛宴

昨晚 7 点,坐标中国台湾大学体育场,英伟达 CEO 黄仁勋为世界带来了一场名为 The Dawn of a New Industrial Revolution (揭开新工业革命序幕)的演讲。

在整个演讲中,老黄重新理解了英伟达与人工智能浪潮的关系,重磅剧透了下一代的 GPU 架构,并且从英伟达一系列“新动作”出发,点明了演讲题目:“AI 时代将会驱动下一场工业革命”

  3.5研究测试:
hujiaoai.cn

4研究测试:
askmanyai.cn

Claude-3研究测试:
hiclaude3.com

从 CPU 到 GPU,老黄挑战摩尔定律

到底是 GPU 架构催生了深度学习革命,还是 AI 发展挖掘出了 GPU 的潜力?在这次演讲中,老黄丝毫不谦虚的给出了英伟达的答案:

如果没有我们精心打造的打造的各类特定领域的库,全球深度学习科学家们就无法充分利用潜力。CUDA就像OpenGL之于计算机图形学,SQL之于数据分析。

人工智能崛起之所以有可能,完全因为我们相信只要让强大的计算变得越来越便宜,总会有人找到巨大的用途。

将 AI 领域这十余年间的锋芒毕露做一个归纳,老黄将一切都归因于 GPU 的发展。伴随着需求计算量指数级的增长,CPU 性能的增长速度已经几乎被证明无法满足「计算通胀」,而真正使得目前我们可以张口闭口谈论天文级别数据量与模型规模的核心,正是来源于英伟达与它的 GPU

图片

老黄如此使用数据描述英伟达芯片过去的成绩:

过去 8 年,英伟达的芯片算力提升了 1000 倍,单位能耗降低至原来的 1/350

如果我们再贴上摩尔定律的内容:

集成电路上可以容纳的晶体管数目在大约每经过18个月到24个月便会增加一倍

图片

恐怕我们也不会惊讶于英伟达的自信:

正因为我们利用特定算法将计算边际成本降低了100万级别,今天使用互联网上的所有数据来训练大模型才成为了所有人默认合乎逻辑的选择,不再有人怀疑和质疑这个做法

One-Year-Rhythm,下一代 GPU 就在一年后?

这场发布会非常吸引人眼球的一点,来源于黄教主提出的「One-Year-Rhythm」的节奏,老黄在演讲中提到:

英伟达新的GPU架构将从两年一次迭代,加速到以一年为周期推出

这个速度非常夸张,要知道英伟达上次革新自己的 GPU 架构不是在三年前而是在三个月前的 GTC大会中推出的 Blackwell。而在仅仅三个月后,黄教主又马不停蹄的给出了新的规划:2025 年,Blackwell Ultra ——> 2026 年,Rubin ——> 2027 年,Rubin Ultra

图片

这种革新速度已经不能用「市场竞争」来形容了,作为 GPU 领域独孤求败的英伟达,现在只能和自己想象中的风车巨人进行搏斗。

而关于此,黄教主只能如是说:

我们的基本理念非常简单,我们要建立整个数据中心,再将它分解,并以一年的节奏部分卖给用户。我们将一切推向技术极限。无论是什么 TSMC 工艺,技术都会把它推向绝对极限,无论是什么封装技术,都将它推向绝对极限,无论是什么存储技术,都将它推向绝对极限,无论是网络技术,光学技术,一切都将被推向极限。

揭开新工业革命序幕

关注大模型的每一位估计都对 Token 这个词并不陌生,而在昨天,老黄给予了它一个中文翻译——词元。

图片

词元,是大模型处理一切“知识”的最小单位,Token 将不同模态的信息进行统一

当然有些词元它可能是影像,它可能是线图,可能是表格、歌曲、演讲、视讯、影片,有可能是任何形式,只要是有意义的,都算是,甚至包括蛋白质、化学分子等等。

而在这个 AI 时代,词元成为了一切的载体,老黄这样说:

几乎所有的事情都可以把它转换成Token,Token是非常有价值的。我们现在所处的不是AI时代,而是一个生成式AI时代。

黄教主将这样一个时代比喻为一个 AI 工厂,它正在生产一种「新形态的大宗商品」,这种产品每个产业都用得到,具有无与伦比的价值。这种工厂将会带来一场工业革命,为许多行业创造一种新的商品,而这种商品,正是「词元」

今年 3 月,英伟达就推出了他们的「推理即服务」产品——NVIDIA NIM,作为一个软件平台,英伟达希望通过 NIM 去简化定制和预先训练的 AI 模型在生产环境中的部署。

图片

整个 NIM 事实上是一个大的容器,这个容器里面打包优化好了各种“软件”,而这个容器可以将企业部署 AI 应用程序的时间,从几天压缩到几分钟:

这些容器,这些container里头有非常多很棒的软件。在这个容器里头有CUDA、cuDNN、TensorRT Triton,它是推理即服务,它是在云端上的一个堆叠。

图片

AI 工厂是一个基础概念,而向上,它几乎可以产生无限的可能,从数字人、物理世界到真正的 Physical AI,伴随着“AI 工厂化”转型,作为 Token 的真正意义上的“生产者”,也难怪于英伟达写出 The Dawn of a New Industrial Revolution 这样一个自负的标题了。

这篇关于老黄自己卷自己!GPU要一年更新一代!预告新动作:AI工厂将吞噬一切的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1028088

相关文章

Deepseek R1模型本地化部署+API接口调用详细教程(释放AI生产力)

《DeepseekR1模型本地化部署+API接口调用详细教程(释放AI生产力)》本文介绍了本地部署DeepSeekR1模型和通过API调用将其集成到VSCode中的过程,作者详细步骤展示了如何下载和... 目录前言一、deepseek R1模型与chatGPT o1系列模型对比二、本地部署步骤1.安装oll

Spring AI Alibaba接入大模型时的依赖问题小结

《SpringAIAlibaba接入大模型时的依赖问题小结》文章介绍了如何在pom.xml文件中配置SpringAIAlibaba依赖,并提供了一个示例pom.xml文件,同时,建议将Maven仓... 目录(一)pom.XML文件:(二)application.yml配置文件(一)pom.xml文件:首

SpringBoot整合DeepSeek实现AI对话功能

《SpringBoot整合DeepSeek实现AI对话功能》本文介绍了如何在SpringBoot项目中整合DeepSeekAPI和本地私有化部署DeepSeekR1模型,通过SpringAI框架简化了... 目录Spring AI版本依赖整合DeepSeek API key整合本地化部署的DeepSeek

PyCharm接入DeepSeek实现AI编程的操作流程

《PyCharm接入DeepSeek实现AI编程的操作流程》DeepSeek是一家专注于人工智能技术研发的公司,致力于开发高性能、低成本的AI模型,接下来,我们把DeepSeek接入到PyCharm中... 目录引言效果演示创建API key在PyCharm中下载Continue插件配置Continue引言

Redis缓存问题与缓存更新机制详解

《Redis缓存问题与缓存更新机制详解》本文主要介绍了缓存问题及其解决方案,包括缓存穿透、缓存击穿、缓存雪崩等问题的成因以及相应的预防和解决方法,同时,还详细探讨了缓存更新机制,包括不同情况下的缓存更... 目录一、缓存问题1.1 缓存穿透1.1.1 问题来源1.1.2 解决方案1.2 缓存击穿1.2.1

Ubuntu系统怎么安装Warp? 新一代AI 终端神器安装使用方法

《Ubuntu系统怎么安装Warp?新一代AI终端神器安装使用方法》Warp是一款使用Rust开发的现代化AI终端工具,该怎么再Ubuntu系统中安装使用呢?下面我们就来看看详细教程... Warp Terminal 是一款使用 Rust 开发的现代化「AI 终端」工具。最初它只支持 MACOS,但在 20

Linux Mint Xia 22.1重磅发布: 重要更新一览

《LinuxMintXia22.1重磅发布:重要更新一览》Beta版LinuxMint“Xia”22.1发布,新版本基于Ubuntu24.04,内核版本为Linux6.8,这... linux Mint 22.1「Xia」正式发布啦!这次更新带来了诸多优化和改进,进一步巩固了 Mint 在 Linux 桌面

SpringCloud配置动态更新原理解析

《SpringCloud配置动态更新原理解析》在微服务架构的浩瀚星海中,服务配置的动态更新如同魔法一般,能够让应用在不重启的情况下,实时响应配置的变更,SpringCloud作为微服务架构中的佼佼者,... 目录一、SpringBoot、Cloud配置的读取二、SpringCloud配置动态刷新三、更新@R

Ubuntu 24.04 LTS怎么关闭 Ubuntu Pro 更新提示弹窗?

《Ubuntu24.04LTS怎么关闭UbuntuPro更新提示弹窗?》Ubuntu每次开机都会弹窗提示安全更新,设置里最多只能取消自动下载,自动更新,但无法做到直接让自动更新的弹窗不出现,... 如果你正在使用 Ubuntu 24.04 LTS,可能会注意到——在使用「软件更新器」或运行 APT 命令时,

Ilya-AI分享的他在OpenAI学习到的15个提示工程技巧

Ilya(不是本人,claude AI)在社交媒体上分享了他在OpenAI学习到的15个Prompt撰写技巧。 以下是详细的内容: 提示精确化:在编写提示时,力求表达清晰准确。清楚地阐述任务需求和概念定义至关重要。例:不用"分析文本",而用"判断这段话的情感倾向:积极、消极还是中性"。 快速迭代:善于快速连续调整提示。熟练的提示工程师能够灵活地进行多轮优化。例:从"总结文章"到"用