全速前进：2024年MAD（机器学习，人工智能和数据）前景（20000字长文）

本文主要是介绍全速前进：2024年MAD（机器学习，人工智能和数据）前景（20000字长文），希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

THE 2024 MAD (MACHINE LEARNING, ARTIFICIAL INTELLIGENCE & DATA) LANDSCAPE 是FirstMark对数据、分析、机器学习和人工智能生态系统的第十次年度展望和「现状」描述。

在这个领域的10多年里，事情从来没有像今天这样令人兴奋和充满希望。我们多年来描述的所有趋势和子趋势都在融合：数据已经大量数字化；它可以用现代工具快速、廉价地存储、处理和分析；最重要的是，它可以被输入到性能更高的ML/AI模型中，这些模型可以理解它，识别模式，根据它做出预测，现在可以生成文本、代码、图像、声音和视频。

MAD（机器学习，人工智能和数据）生态系统已经从小范围和技术走向主流。这种模式的转变似乎正在加速，其影响远远超出了技术甚至商业问题，并影响到社会、地缘政治，甚至人类的状况。

然而，在未来几十年的大趋势中，仍有许多篇章有待书写。就像每年一样，这篇文章试图通过产品、公司和行业趋势来理解我们目前所处的位置。

本年度的概况分为三个部分：

第一部分：全景图
第二部分：2024年我们思考的24个主题
第三部分：融资、并购和IPO

第一部分：全景图

点击「阅读原文」，获得PDF文件链接

公司的数量

2024年MAD景观共包含2011个logo。这一数字高于去年的1416名，其中有578名新上榜者。作为参考，2012年的第一个版本只有139个logo。

这一领域如此拥挤（疯狂？）的本质主要是由两波接连不断的公司创建和融资浪潮造成的。

第一波浪潮是长达10年的数据基础设施周期，从大数据开始，到现代数据堆栈结束。该领域期待已久的整合尚未真正发生，绝大多数公司仍在运营。

第二波浪潮是ML/AI周期，始于生成式AI。由于我们正处于本轮周期的早期阶段，而且大多数公司都非常年轻，因此我们对年轻的初创公司（其中很多仍处于种子阶段）持开放态度。

注意：这两个波是密切相关的。每年MAD景观的一个核心理念是展示数据基础设施之间的共生关系（在左侧）；分析/BI和ML/AI（在中间）和应用程序（在右边）。

虽然每年都很难适应不断增加的公司数量，但最终，将MAD空间视为装配线的最佳方式-从收集到存储到处理到通过分析或应用程序提供价值的整个数据生命周期。

两大浪潮+有限的整合=市场上有很多公司。

「基础设施」和「分析」的主要变化

我们对左侧景观的整体结构做了很少的改变-正如我们将在下面看到的（现代数据堆栈死了吗？），这部分的MAD景观最近很少受到关注。

一些值得注意的变化：我们将「数据库抽象」重命名为「多模型数据库和抽象」，以抓住围绕一体化「多模型」数据库组（SurrealDB*， EdgeDB）的上升浪潮；取消了我们去年实验性创建的「加密/ Web 3分析」部分，这在目前的形势下感觉不太合适；并删除了「查询引擎」部分，它感觉更像是一个部分的一部分而不是一个单独的部分（该部分的所有公司仍然出现在景观中- Dremio, Starburst, PrestoDB等）。

「机器学习与人工智能」的主要变化

随着2023年人工智能公司的爆炸式增长，这是迄今为止我们发现自己正在进行的最大结构性变革。

鉴于去年「人工智能实现」层的巨大活动，我们在机器学习运营（MLOPs）旁添加了3个新类别：

「人工智能可观察性」是今年的一个新类别，初创公司帮助测试、评估和监控大模型应用程序
「AI开发者平台」在概念上接近于MLOps，但我们想要认识到完全专注于AI应用程序开发的平台浪潮，特别是围绕大模型培训，部署和推理
「人工智能安全和安保」包括解决大模型固有问题的公司，从幻觉到道德、监管合规等

如果说山姆·奥特曼和埃隆·马斯克之间的公开争吵告诉了我们什么的话，那就是，对于基础模型开发者来说，商业和非营利之间的区别是至关重要的。因此，我们将之前的「横向AI/AGI」分为两类：「商业AI研究」和「非营利AI研究」。

我们做的最后一个改变是另一个命名，我们修改了「GPU云」，以反映许多GPU云提供商所做的核心基础设施功能集：「GPU云/ ML基础设施」。

「应用程序」的主要变化

这里最大的更新是……毫无疑问……每个应用层公司现在都自称为「人工智能公司」 ——正如我们试图过滤的那样，这推动了今年MAD景观右侧新标识的爆炸式增长。

结构方面的一些小变化：

在「横向应用」中，我们增加了一个「演示和设计」类别
我们将「搜索」重新命名为「搜索/会话AI」，以反映大模型支持的基于聊天的界面（如Perplexity）的兴起。
在「工业」部分，我们将「政府与情报」重新命名为「航空航天、国防与政府」。

「开源基础设施」的主要变化

我们合并了一直很接近的类别，创建了一个单一的「数据管理」类别，涵盖了「数据访问」和「数据操作」两个类别。

我们增加了一个重要的新类别，「本地人工智能」，因为搭建方试图提供基础设施工具，将人工智能和大模型带入本地开发时代。

第二部分：2024年我们思考的24个主题

人工智能的发展如此之快，覆盖面如此之广，几乎不可能像前几年那样提供一个全面的「联盟状态」。

所以这里有一个不同的格式：没有特定的顺序，这里有24个最重要的和/或经常在谈话中出现的主题。有些是相当充实的想法，有些很大程度上只是问题或思想实验。

结构化数据与非结构化数据

这部分是一个主题，部分是我们发现自己在对话中经常提到的东西，以帮助解释当前的趋势。

因此，也许作为对2024年讨论的介绍，这里有一个重要的提示，它解释了一些关键的行业趋势。并非所有数据都是相同的。冒着过度简化的风险，有两个主要的数据家族，围绕每个家族，出现了一组工具和用例。

结构化数据管道：即可以装入行和列的数据。

出于分析目的，数据从事务性数据库和SaaS工具中提取，存储在云数据仓库（如Snowflake）中，使用商业智能（BI）工具进行转换、分析和可视化，主要是为了理解现在和过去（即所谓的「描述性分析」）。这条装配线通常由下面讨论的现代数据堆栈启用，分析是核心用例。

此外，结构化数据也可以输入到「传统的」 ML/AI模型中，用于预测未来（预测分析）——例如，哪些客户最有可能流失

非结构化数据管道：这是一个数据世界，通常不适合行和列，如文本、图像、音频和视频。非结构化数据主要用于生成式人工智能模型（LLM等），用于训练和使用（推理）它们。

这两个数据家族（以及相关的工具和公司）目前正经历着截然不同的命运和关注程度。

非结构化数据（ML/AI）很热门；结构化数据（现代数据堆栈等）则不是。

现代数据栈死了吗？

就在不久前（2019-2021年），软件世界里没有什么比现代数据堆栈（MDS）更性感的了。与「大数据」（Big Data）一样，它是为数不多的基础设施概念之一，从数据工程师向更广泛的受众（高管、记者、银行家）传播。

现代数据栈基本上涵盖了上面提到的结构化数据管道。它被快速增长的云数据仓库所吸引，供应商定位在它的上游（如Fivetran和Airbyte），顶部（DBT）和下游（Looker, Mode）。

随着Snowflake成为有史以来规模最大的软件公司IPO，人们对MDS的兴趣激增，在零利率政策的推动下，涌现了大量初创公司和风险投资。整个类别在一两年内变得过于拥挤——数据目录、数据可观测性、ETL、反向ETL等等。

现代数据栈是一个解决实际问题的真正方案，也是一个营销概念，实际上是跨数据价值链的许多初创公司之间的联盟。

快进到今天，情况就大不相同了。在2023年，我们曾预告过MDS「面临压力」，而这种压力在2024年只会继续加剧。

MDS面临两个关键问题：

将现代数据堆栈整合在一起需要将来自多个独立供应商的各种最佳解决方案拼接在一起。因此，它在金钱、时间和资源方面都是昂贵的。在零利率政策后削减预算的时代，CFO部门并不看好这一点
MDS不再是街上的酷孩子了。生成式人工智能已经从高管、风投和媒体那里抢走了所有的注意力——它需要我们上面提到的那种非结构化数据管道。

数据基础设施的整合，大者恒大

鉴于上述情况，2024年数据基础设施和分析领域接下来会发生什么？

它可能看起来像这样：

在现代数据堆栈及其周围的许多初创公司将积极地重新定位为「人工智能基础设施初创公司」，并试图在现代人工智能堆栈中找到一席之地（见下文）。这在某些情况下是可行的，但在大多数情况下，从结构化数据到非结构化数据可能需要一个基本的产品进化。
数据基础设施行业最终将出现一些整合。到目前为止，并购相当有限，但在2023年确实发生了一些收购，无论是合并收购还是中等规模的收购——包括Stemma（被Teradata收购）、Manta（被IBM收购）、Mode（被Thoughtspot收购）等（见下文第三部分）。
将会有更多的创业失败——随着风投资金的枯竭，事情变得越来越艰难。许多创业公司大幅削减了成本，但总有一天他们的现金流会结束。不要期望看到华而不实的头条新闻，但这将（可悲地）发生。
该领域的大公司，无论是规模扩大的公司还是上市公司，都将加倍投入他们的平台，并努力覆盖更多的功能。其中一些将通过收购（因此将进行整合）实现，但很多也将通过本土开发实现。

Databricks vs Snowflake

说到这个领域的大公司，让我们来看看两个关键的数据基础设施参与者Snowflake和Databricks之间的「泰坦尼克冲击」。

Snowflake（历史上来自结构化数据管道领域）仍然是一家令人难以置信的公司，也是市值最高的上市科技股之一（截至撰写本文时，其EV/NTM收入为14.8倍）。然而，就像许多软件行业一样，它的增长速度急剧放缓——2024财年结束时，它的产品收入同比增长38%，总计26.7亿美元，预计截至撰写本文时，NTM收入增长22%）。也许最重要的是，Snowflake给人的印象是一家在产品方面面临压力的公司——它在拥抱人工智能方面进展较慢，收购意愿相对较低。最近，有点突兀的CEO换届是另一个有趣的数据点。

Databricks（历史上来自非结构化数据管道和机器学习领域）正经历着全方位的强劲势头，据报道（因为它仍然是一家私营公司）在24财年结束时收入为16亿美元，增长50%以上。重要的是，Databricks正在成为一个关键的生成式人工智能参与者，无论是通过收购（最值得注意的是，以13亿美元收购了MosaicML）还是自主产品开发——首先，它是为大模型提供非结构化数据的关键存储库，同时也是模型的创造者，从Dolly到DBRX，该公司在撰写本文时刚刚宣布了一种新的生成式人工智能模型。

在Snowflake和Databricks的竞争中，主要的新进展是Microsoft Fabric的推出。它于2023年5月发布，是一个端到端、基于云的数据和分析SaaS平台。它集成了许多微软产品，包括OneLake（开放式湖屋）、PowerBI和Synapse Data Science，基本上涵盖了从数据集成和工程到数据科学的所有数据和分析工作流。就像大公司的产品发布一样，公告和产品的现实之间总是存在差距，但结合微软在生成式人工智能方面的大力推动，这可能会成为一个强大的威胁（作为故事的另一个转折，Databricks很大程度上是建立在Azure之上的）。

2024年的BI，生成式人工智能将改变数据分析吗？

在现代数据堆栈和结构化数据管道世界的所有部分中，感觉最成熟的重新发明的类别是商业智能。我们在2019年的MAD中强调了商业智能行业几乎完全整合的情况，并讨论了2021年MAD中指标商店的出现。

BI/分析的转型比我们预期的要慢。该行业仍主要由老产品主导，如微软的PowerBI、Salesforce的Tableau和谷歌的Looker，这些产品有时会在更广泛的销售合同中免费捆绑。更多的合并发生了（Thoughtspot收购了Mode；Sisu被Snowflake悄悄收购了）。一些年轻的公司正在采取创新的方法，无论是扩大规模（参见dbt和他们的语义层/MetricFlow）还是初创公司（参见Trace*和他们的指标树），但他们通常还处于起步阶段。

除了在数据提取和转换方面发挥强大的作用外，生成式人工智能还可能在数据分析的超级动力和民主化方面产生深远的影响。

确实有很多活动。OpenAI推出了代码解释器，后来更名为高级数据分析。微软为金融工作者推出了一款使用Excel的人工智能聊天机器人Copilot。在云供应商、Databricks、Snowflake、开源和大量初创公司中，许多人正在开发或已经发布了「文本到SQL」产品，以帮助使用自然语言在数据库中运行查询。

这一前景既令人兴奋，也可能具有颠覆性。数据分析的圣杯是它的民主化。如果自然语言成为笔记本、数据库和BI工具的接口，它将使更广泛的人群能够进行分析。

然而，BI行业的许多人对此持怀疑态度。SQL的精确性和理解查询背后的业务上下文的细微差别被认为是自动化的主要障碍。

现代AI堆栈的崛起

到目前为止，我们讨论的很多内容都与结构化数据管道世界有关。

如前所述，非结构化数据基础设施的世界正在经历一个非常不同的时刻。非结构化数据是大模型课程的主要内容，对它的需求非常旺盛。每一家正在试验或部署生成式人工智能的公司都在重新发现一句老话：「数据是新的石油」。每个人都想要大模型的力量，但他们的（企业）数据训练。

大大小小的公司都在争先恐后地抓住机会，为生成式人工智能提供基础设施。

几家人工智能扩展公司一直在积极发展他们的产品，以利用市场势头——从Databricks（见上文）到Scale AI（发展了他们的标签基础设施，最初是为自动驾驶汽车市场开发的，与OpenAI等公司合作作为企业数据管道），再到Dataiku*（推出了他们的LLM Mesh，使全球2000强公司能够无缝地跨多个LLM供应商和模型工作）。

与此同时，新一代人工智能基础设施初创公司正在涌现，涉及多个领域，包括：

向量数据库，以生成式人工智能模型可以使用的格式（向量嵌入）存储数据。专业供应商（Pinecone, Weaviate, Chroma, Qudrant等）已经有了一个丰收的一年，但一些现有的数据库玩家（MongoDB）也很快做出反应，增加了矢量搜索功能。还有一个正在进行的争论是，更长的上下文窗口是否会完全消除对矢量数据库的需求，争论的双方都有强烈的意见。
框架（LlamaIndex, Langchain等），连接和编排所有移动的部分
护栏，位于LLM和用户之间，确保模型提供的输出符合组织的规则。
评估人员帮助测试、分析和监控生成人工智能模型的性能，这是一个难题，在公共基准测试中普遍存在不信任
路由器，帮助实时引导不同型号的用户查询，以优化性能、成本和用户体验
成本保护，这有助于监控使用大模型的成本
端点，有效地将底层基础设施（如模型）的复杂性抽象出来的API

考虑到现代数据堆栈的历史，我们一直拒绝使用「现代AI堆栈」这个术语。

但这句话也有很多相似之处：许多初创公司都是当下的「热门公司」，就像之前的MDS公司一样，它们往往成群结队，建立营销联盟和产品合作伙伴关系。

新一代的人工智能基础设施初创公司将面临与之前的MDS公司相同的挑战：这些领域是否足够大，足以建立一家价值数十亿美元的公司？大公司（主要是云服务提供商，但也包括Databricks和Snowflake）最终会在哪些方面进行自我建设？

我们在人工智能Hype Cycle中处于什么位置？

人工智能有几十年的夏季和冬季历史。就在过去的10-12年里，这是我们经历的第三个人工智能Hype Cycle：2013-2015年，深度学习在ImageNet 2012之后成为人们关注的焦点；另一次是在2017-2018年聊天机器人热潮和TensorFlow兴起期间；现在从2022年11月开始使用生成人工智能。

这种Hype Cycle特别激烈，以至于感觉像是人工智能泡沫，原因有很多：技术令人难以置信地令人印象深刻；它是非常发自内心的，并且跨越了科技圈之外的广泛受众；对于坐拥大量资金的风投来说，这是唯一的游戏，因为几乎所有其他技术领域都处于低迷状态。

炒作带来了所有通常的好处（「没有非理性繁荣就没有伟大的成就」，「让1000朵花开花结果」阶段，有大量资金可用于雄心勃勃的项目）和噪音（一夜之间每个人都是人工智能专家，每个初创公司都是人工智能初创公司，太多的人工智能会议/播客/新闻通讯……我们敢说，太多的人工智能市场地图？？）。

任何Hype Cycle的主要问题都是不可避免的反弹。

这个市场阶段存在着相当多的「怪癖」和风险：该领域的典型公司拥有非常不同寻常的法律和治理结构；有很多「以计算换股权」的交易（可能是往返交易）没有被完全理解或披露；很多顶尖的初创公司都是由人工智能研究团队运营的；很多风投交易让人想起零利率政策时代：「抢地」、大轮融资和对非常年轻的公司令人瞠目的估值。

当然，人工智能的炒作已经出现了裂缝（见下文），但我们仍然处于每周都有新事物让每个人大吃一惊的阶段。而像沙特阿拉伯400亿美元的人工智能基金这样的消息似乎表明，资金流入这个领域不会很快停止。

实验与现实：2023年是假的吗？

与上述相关的是，考虑到炒作，到目前为止，有多少是真实的，而仅仅是实验性的？

2023年是充满行动的一年：a）每个技术供应商都急于在他们的产品中加入生成式人工智能，b）每个全球2000强董事会都要求他们的团队「做人工智能」，一些企业的部署速度创下了纪录，包括摩根士丹利和花旗银行等受监管行业的公司。c）当然，消费者对生成式人工智能应用表现出了浓厚的兴趣。

因此，2023年是一个巨大的胜利之年：OpenAI的年运营率达到了20亿美元；Anthropic的增长速度使其能够预测2024年的收入为8.5亿美元；Midjourney在没有任何投资和40人团队的情况下，营收增长到2亿美元；《Perplexity AI》的月活跃用户从0增长到1000万等等。

我们应该愤世嫉俗吗？一些问题：

在企业中，很多花费都花在了概念的验证上，或者是容易获得的成果，这些通常来自于创新预算。
与解决实际业务问题相比，高管们不想显得手足无措，这在多大程度上受到了推动？
在消费者中，人工智能应用的流失率很高。多少只是出于好奇？
在他们的个人生活和职业生涯中，许多人都不完全确定如何使用生成式人工智能应用程序和产品
并不是所有的生成式人工智能产品，即使是那些由最优秀的人工智能人才打造的产品，都将是神奇的：我们是否应该将Inflection AI在融资13亿美元后迅速退出的决定视为承认世界不需要另一个人工智能聊天机器人，甚至不需要大模型提供商？

大模型公司：也许根本没有那么商品化？

数以十亿计的风险资本和企业资金正在投资于基础模式公司。

因此，在过去的18个月里，每个人都最喜欢问的问题是：我们正在目睹一场惊人的资本烧钱，最终变成了商品化的产品吗？或者这些LLM提供商是新的AWS、Azure和GCP？

一个令人不安的事实（对相关公司来说）是，大模型似乎没有建立持久的性能优势。在撰写本文时，Claude 3 Sonnet和Gemini Pro 1.5的性能优于GPT-4, GPT-4的性能优于Gemini 1.0 Ultra，等等，但这种情况似乎每隔几周就会发生变化。性能也会波动——ChatGPT在某些时候会暂时「失去理智」和「变得懒惰」。

此外，开源模型（Llama 3、Mistral和其他类似DBRX的模型）在性能方面正在迅速赶上。

另外，市场上的大模型提供商比最初出现的要多得多。几年前，流行的说法是，只有一两个大模型公司，有赢家通吃的动态——部分原因是世界上有必要的专业知识的人很少。

事实证明，有能力的团队比最初预期的要多。除了OpenAI和Anthropic，还有许多初创公司在做基础的人工智能工作——Mistral、Cohere、Adept、AI21、Imbue、01。举几个例子，当然还有谷歌、Meta等公司的团队。

话虽如此，到目前为止，大模型提供商似乎做得很好。OpenAI和Anthropic的收入正以惊人的速度增长，非常感谢。也许LLM模式真的商品化了，LLM公司仍然有巨大的商业机会。他们已经成为「全栈」公司，在底层模型之上，为多种受众（消费者、企业、开发人员）提供应用程序和工具。

也许云计算供应商的类比确实非常恰当。AWS、Azure和GCP通过应用程序/工具层吸引和留住客户，并通过基本上没有区别的计算/存储层获利。

大模型，SLM和混合未来

对于大型语言模型的所有兴奋，过去几个月的一个明显趋势是小型语言模型（SLM）的加速，例如Meta的Llama-2-13b, Mistral的Mistral-7b和Mistral 8x7b以及微软的pi -2和Orca-2。

虽然LLM越来越大（据报道，GPT-3有1750亿个参数，GPT-4有1.7万亿个参数，而世界正在等待更大的GPT-5），但SLM正在成为许多用例的强大替代方案，因为它们操作成本更低，更容易调优，并且通常提供强大的性能。

另一个加速的趋势是专门模型的兴起，专注于特定任务，如编码（Code-Llama, Poolside AI）或行业（例如彭博的金融模型，或初创公司Orbital Materials为材料科学建立模型等）。

正如我们已经在许多企业部署中看到的那样，世界正在迅速向混合架构发展，将多个模型组合在一起。

尽管价格一直在下降（见下文），但大型专有LLM仍然非常昂贵，并且存在延迟问题，因此用户/客户将越来越多地部署模型组合，大型和小型，商业和开源，通用和专用，以满足他们的特定需求和成本限制。

传统AI已死吗？

随着ChatGPT的推出，一件有趣的事情发生了：在此之前部署的许多人工智能在一夜之间被贴上了「传统人工智能」的标签，而不是「生成式人工智能」。

这对许多人工智能从业者和公司来说有点震惊，因为在此之前，他们一直被认为在从事前沿工作，因为「传统」一词显然表明，所有形式的人工智能都即将被新事物大规模取代。

现实情况要微妙得多。传统AI和生成AI在处理不同类型的数据和用例时是非常互补的。

现在被称为「传统人工智能」，或者偶尔被称为「预测人工智能」或「表格人工智能」的东西，也是现代人工智能（基于深度学习）的重要组成部分。然而，它通常关注结构化数据（见上文），以及推荐、流失预测、定价优化、库存管理等问题。「传统人工智能」在过去十年中得到了广泛的应用，并且已经在全球数千家公司中大规模应用。

相比之下，生成式AI主要操作非结构化数据（文本、图像、视频等）。在不同类型的问题（代码生成、图像生成、搜索等）上表现出色。

在这方面，未来也是混合的：公司将在某些任务上使用大模型，在其他任务上使用预测模型。最重要的是，它们通常会将它们结合起来——大模型可能不擅长提供精确的预测，比如客户流失预测，但你可以使用一个大模型来调用另一个专注于提供预测的模型的输出，反之亦然。

薄包装器，厚包装器，目标为全栈的比赛

「薄包装器」是2023年每个人都喜欢用的轻蔑词汇。如果你的核心能力是由别人的技术（比如OpenAI）提供的，那么就很难建立持久的价值和差异化。几个月前，有报道称，像Jasper这样的初创公司在经历了收入的快速增长后，陷入了困境，这似乎证实了这种想法。

有趣的问题是，随着时间的推移，年轻的初创公司会建立更多的功能。薄的包装会变厚吗？

到2024年，「厚包装」可能会走向差异化：

专注于一个特定的问题，通常是垂直的——因为任何过于横向的事情都有可能进入大型科技公司的「杀伤区」
构建特定于该问题的工作流、协作和深度集成
在人工智能模型层面做大量工作——无论是用特定数据集微调模型，还是为特定业务创建混合系统（LLM、SLM等）
换句话说，它们需要既窄又「全栈」（应用程序和基础设施）。

2024年值得关注的领域：人工智能代理、边缘人工智能

在过去的一年里，围绕人工智能代理的概念有很多令人兴奋的事情——基本上是智能系统的最后一英里，它可以执行任务，通常以协作的方式。这可以是任何事情，从帮助预订旅行（消费者用例）到自动运行完整的SDR活动（生产力用例），再到RPA风格的自动化（企业用例）。

人工智能代理是自动化的圣杯——一种「文本到行动」的范式，人工智能为我们完成任务。

从去年的BabyAGI到最近的Devin AI（一名「人工智能软件工程师」），每隔几个月，人工智能世界就会为类似代理的产品而疯狂。然而，总的来说，这种兴奋到目前为止还为时过早。在涉及多个模型的复杂系统能够协同工作并代表我们采取实际行动之前，要使生成系统不那么脆弱，更容易预测，还有很多工作要做。还有一些缺失的组件，比如需要在人工智能系统中构建更多的内存。然而，预计人工智能代理将在未来一两年成为一个特别令人兴奋的领域。

另一个有趣的领域是边缘AI。尽管大规模运行并作为终端交付的LLM有巨大的市场，但人工智能领域的圣杯一直是能够在设备上本地运行的模型，不需要GPU，尤其是手机，也包括智能物联网类型的设备。这个空间非常有活力：Mixtral、Ollama、Llamafile、GPT4ALL （Nomic）。谷歌和苹果也可能越来越活跃。

生成式人工智能是走向AGI，还是走向平稳期？

考虑到所有关于人工智能的令人窒息的报道，以及似乎每周都出现的令人难以置信的新产品，问这个问题几乎是一个亵渎神灵的问题——但是，在这个世界上，生成式人工智能的进步会放缓，而不是一直加速到AGI吗？这意味着什么呢？

这个论点是双重的：a）基础模型是一种蛮力练习，我们将耗尽资源（计算，数据）来提供它们；b）即使我们没有耗尽资源，最终通往AGI的道路是推理，这是大模型无法做到的。

有趣的是，正如我们在2018年的一篇博客文章中所描述的，这与6年前的行业讨论或多或少是相同的。事实上，自2018年以来发生的最大变化似乎是我们向（越来越强大的）模型投入的大量数据和计算。

总的来说，我们在人工智能推理方面取得了多大的进展还不太清楚，尽管DeepMind的程序AlphaGeometry似乎是一个重要的里程碑，因为它将语言模型与符号引擎结合在一起，逻辑规则可以进行推理。

我们距离计算机或数据「耗尽」还有多远，这很难评估。

「耗尽计算能力」的界限似乎每天都在被进一步推后。英伟达最近发布了Blackwell GPU系统，该公司表示，它可以部署27万亿参数模型（而GPT-4的参数模型为1.7万亿）。

数据部分是复杂的——有一个更策略性的问题是关于用光合法许可的数据（参见所有OpenAI许可交易），还有一个更广泛的问题是关于用光文本数据。当然，围绕合成数据有很多工作要做。Yann LeCun讨论了如何将模型提升到一个新的水平，可能需要它们能够摄取更丰富的视频输入，这是不可能的。

人们对GPT-5有着很高的期望。它会比GPT-4好多少，将被广泛视为人工智能整体进展速度的风向标。

从创业生态系统参与者（创始人、投资者）的狭隘角度来看，从中期来看，这个问题可能不那么重要——如果明天生成人工智能的进展达到渐近线，我们仍然有几年的商业机会，可以在垂直领域和用例中部署我们目前拥有的东西。

GPU大战（英伟达被高估了吗？）

我们是处于一个巨大周期的早期阶段，计算将成为世界上最宝贵的商品，还是以一种肯定会导致大崩溃的方式过度生产GPU ？

在面向生成人工智能（Generative AI-ready）的GPU领域，英伟达（NVIDIA）几乎是唯一的佼佼者。自2022年底以来，英伟达的股价上涨了5倍，估值达到2.2万亿美元，总销售额增长了3倍。人们对英伟达的收益感到非常兴奋，黄仁勋（Jensen Huang）在GTC上与泰勒·斯威夫特（Taylor Swift）竞争2024年最大的活动。

也许这也部分是因为它是风投在人工智能领域数十亿投资的最终受益者？

不管怎样，尽管英伟达作为一家公司拥有不可否认的实力，但它的命运将与当前淘金热的可持续性有关。硬件很难，准确预测台积电需要在台湾生产多少GPU也是一件难事。

此外，从AMD到英特尔再到三星，竞争对手也在尽最大努力做出反应；初创公司（如Groq或Cerebras）正在加速发展，新的公司可能会形成，比如山姆·奥特曼传闻的价值7万亿美元的芯片公司。包括谷歌、英特尔和高通在内的科技公司组成了一个新的联盟，正试图攻击英伟达的秘密武器：该公司的CUDA软件，该软件使开发人员与英伟达的芯片绑定在一起。

我们的看法是：随着GPU短缺的消退，英伟达可能会面临中短期的下行压力，但人工智能芯片制造商的长期前景仍然非常光明。

开源AI：好东西太多了？

这个只是稍微搅拌一下锅。我们是开源AI的忠实粉丝，很明显这是过去一年左右的大趋势。Meta凭借其Llama模型取得了重大进展，法国的Mistral从争议的素材变成了生成人工智能的新明星，谷歌发布了Gemma, HuggingFace继续作为开源人工智能的充满活力的家园，托管了大量的模型。生成式人工智能中一些最具创新性的工作是在开源社区完成的。

然而，也有一种普遍的膨胀感弥漫在开源社区。现在有成千上万的开源人工智能模型可用。许多是玩具或周末项目。模型在排名上有上有下，其中一些在几天内经历了Github星级标准（一个有缺陷的指标，但仍然）的迅速上升，只是从来没有转变成任何特别可用的东西。

市场将自我修正，成功的开源项目将得到云提供商和其他大型科技公司不成比例的支持。但与此同时，当前的爆发令许多人感到头晕目眩。

人工智能到底要花多少钱？

生成式人工智能的经济学是一个快速发展的话题。毫不奇怪，未来的许多领域都围绕着它——例如，如果提供人工智能驱动的答案的成本明显高于提供10个蓝色链接的成本，那么有人能在搜索领域挑战谷歌吗？如果推理成本吞噬了软件公司的大部分毛利率，它们真的能依靠人工智能驱动吗？

好消息是，如果你是人工智能模型的客户/用户：我们似乎正处于价格竞争的早期阶段，这比人们预测的要快。一个关键的驱动因素是开源人工智能（Mistral等）和商业推理供应商（Together AI, Anyscale, Replit）的并行崛起，它们将这些开放模型作为端点。客户的转换成本非常低（除了使用不同模型产生不同结果的复杂性），这给OpenAI和Anthropic带来了压力。这方面的一个例子就是嵌入模型的成本大幅下降，多个供应商（OpenAI, Together AI等）同时降低了价格。

从供应商的角度来看，构建和服务人工智能的成本仍然非常高。据媒体报道，Anthropic将其收入的一半以上用于支付AWS和GCP等云服务提供商的LLM运营费用。与发行商达成授权协议也有成本

从好的方面来看，也许我们所有的生成技术用户都应该享受风险投资补贴的免费服务的爆炸式增长：

大公司和人工智能政治经济的转变：微软赢了吗？

这是每个人在2022年底问的第一个问题之一，在2024年更是首要的问题：大型科技公司会抓住生成式人工智能的大部分价值吗？

人工智能奖励规模——更多的数据、更多的计算、更多的人工智能研究人员往往会产生更大的能力。大型科技公司已经敏锐地意识到了这一点。与之前的平台转型不同，它也对未来潜在的颠覆做出了强烈反应。

在大型科技公司中，微软（Microsoft）似乎一直在玩4D国际象棋。微软在2019年首次投资OpenAI，现在已经投资了130亿美元。但微软也与开源竞争对手Mistral合作。它投资了ChatGPT的竞争对手Inflection AI （Pi），但最近却以惊人的方式收购了后者。

最终，所有这些合作似乎只会增加对微软云计算的需求——2024年第二季度，Azure的收入同比增长24%，达到330亿美元，其中6%的Azure云增长归功于人工智能服务。

与此同时，谷歌和亚马逊已经与OpenAI的竞争对手Anthropic合作并进行了投资（在撰写本文时，亚马逊刚刚向该公司承诺再投资27.5亿美元，这是其计划投资40亿美元的第二部分）。亚马逊还与开源平台Hug Face合作。据报道，谷歌和苹果正在讨论将Gemini人工智能整合到苹果产品中。Meta可能会通过全力投入开源AI而削弱所有人。然后是中国发生的一切。

一个显而易见的问题是，创业公司成长和成功的空间有多大？第一级创业公司（主要是OpenAI和Anthropic，可能Mistral很快也会加入）似乎已经找到了正确的合作伙伴关系，并达到了逃逸速度。对于许多其他初创公司，包括资金雄厚的初创公司，目前尚无定论。

我们是否应该把Inflection AI决定让自己被收购，以及Stability AI的首席执行官陷入困境，解读为一群「二线」生成式AI初创公司承认更难获得商业吸引力？

是否喜欢OpenAI ？

OpenAI仍然令人着迷——860亿美元的估值、收入增长、宫廷阴谋，以及山姆·奥特曼是这一代的史蒂夫·乔布斯。

几个有趣的问题：

OpenAI做得太多了吗？在11月的「OpenAI开发日」之前，OpenAI明确表示，它将在AI领域做「一切」，包括纵向（全栈）和横向（跨用例）：模型+基础设施+消费者搜索+企业+分析+开发工具+市场等。当一家初创公司是一场重大范式转变的早期领导者，实际上可以无限制地获得资本（Coinbase在加密领域就是这样做的），这并不是一种前所未有的战略。但值得关注的是：虽然它肯定会简化MAD的格局，但这将是一个艰巨的执行挑战，尤其是在竞争加剧的背景下。从ChatGPT的懒惰问题到其市场努力的平淡表现，都表明OpenAI也不能免受商业引力定律的影响。

OpenAI和微软会分手吗？与微软的关系一直很迷人——显然，微软的支持在资源（包括计算）和分布（企业中的Azure）方面对OpenAI起到了巨大的推动作用，这一举动被广泛认为是微软在生成人工智能浪潮早期的一次重大举措。与此同时，正如上面提到的，微软已经明确表示，它不依赖于OpenAI（拥有所有的代码、权重和数据），它已经与竞争对手（例如Mistral）合作，并且通过收购Inflection AI，它现在已经大大加强了它的人工智能研究团队。

与此同时，OpenAI是否希望继续与微软合作，而不是部署在其他云上？

考虑到OpenAI的巨大野心，以及微软的全球统治目标，这两家公司在什么时候会认为他们更像是竞争对手而不是合作伙伴？

2024年将是人工智能进入企业的一年吗？

如上所述，2023年对企业（从方向上定义为全球2000强公司）来说是关键的一年，每个人都争先恐后地拥抱新趋势，但实际上什么也没发生。

有一些概念验证，并采用了谨慎的人工智能产品，这些产品可以在不需要全公司努力的情况下「快速获胜」（例如，用于培训和企业知识的人工智能视频，如Synthesia*）。

除此之外，到目前为止，企业中生成人工智能的最大赢家可能是埃森哲（Accenture）（据报道，埃森哲去年为人工智能咨询带来了20亿美元的费用）。

无论如何，2024年将是人工智能在企业中的重要一年——或者至少是生成式人工智能的重要一年，因为传统人工智能已经在那里占据了重要的地位（见上文）。

但对于全球2000强企业面临的一些关键问题，我们的回答还为时过早：

用例是什么？到目前为止，最容易实现的用例主要是a）开发团队的代码生成副驾驶员，b）企业知识管理（搜索、文本摘要、翻译等），以及c）客户服务的人工智能聊天机器人（一个早于生成式人工智能的用例）。当然还有其他（市场营销、自动化sdr等），但还有很多需要弄清楚的（副驾驶模式与全自动模式等）。

我们应该选择什么工具呢？如上所述，感觉未来是混合的，商业供应商和开源，大模型和小模型，水平和垂直GenAI工具的结合。但是从哪里开始呢？

谁将部署和维护这些工具？全球2000强企业明显存在技能短缺。如果你认为招聘软件开发人员很难，那就试着招聘机器学习工程师吧。

我们怎么确保他们不会产生幻觉？是的，围绕RAG、护栏和评估等，我们做了大量的工作，但生成人工智能工具可能是完全错误的，以及我们不知道生成人工智能模型如何工作的更广泛的问题，都是企业面临的大问题。

投资回报率是什么？大型科技公司很早就开始利用生成式人工智能来满足自己的需求，他们展示了有趣的早期数据。在财报电话会议上，Palo Alto Networks提到将T&E服务的成本降低了大约一半，ServiceNow提到将开发者的创新速度提高了52%，但我们对企业中生成式人工智能的成本/回报方程的理解还很早期。

对于生成式人工智能供应商来说，好消息是企业客户对分配预算（重要的是，不再是「创新」预算，而是实际的运营成本预算，可能从其他地方重新分配）和资源感兴趣。但我们谈论的可能是3-5年的部署周期，而不是1年。

人工智能会杀死SaaS吗？

这是过去12个月的流行观点之一。

这个问题的一个版本是：人工智能使它的代码效率提高了10倍，所以只需要几个普通的开发人员，你就可以创建一个定制版本的SaaS产品，根据你的需求量身定制。既然可以构建自己的软件即服务提供商，为什么还要花那么多钱给他们呢？

这个问题的另一个版本是：未来是一个人工智能（可能由几个模型组成），它通过一系列代理来管理你的整个公司。你不再购买人力资源软件、财务软件或销售软件，因为人工智能以完全自动化和无缝的方式完成了所有工作。

我们似乎离这两种趋势的全面发展还很遥远，但我们都知道，人工智能的变化非常快。

与此同时，未来的SaaS产品可能会变得更加强大，因为每一款产品都内置了人工智能。

人工智能会扼杀风险投资吗？

暂且不谈人工智能是否可以在公司选择和投资后增值方面实现风险投资自动化这一（一直很有趣的）话题，还有一系列有趣的问题，即人工智能平台转型的资产类别规模是否合适：

风险投资规模太小了吗？全球的OpenAI需要筹集数十亿美元，可能还需要筹集更多。这些数十亿美元中的大部分是由像微软这样的大公司提供的——可能大部分是以计算机换股权交易的形式提供的。当然，许多风投已经投资了大型基础模式公司，但至少，这些投资与传统的风投软件投资模式明显不同。也许人工智能投资将需要超大规模的风投基金——在撰写本文时，沙特阿拉伯似乎即将与美国风投公司合作推出一只400亿美元的人工智能基金。

风险投资是不是太大了？如果你相信人工智能将使我们的生产力提高10倍，包括超级编码员、自动SDR代理和自动营销创造，那么我们将见证由骨干团队（或者可能只有一个单独的创业者）运营的整整一代全自动公司的诞生，理论上可以达到数亿美元的收入（并上市）？

一家由个人创业者运营的年平均收益（ARR） 1亿美元的公司，在其发展历程的任何阶段都需要风险投资吗？

人工智能会重振消费者吗？

自社交媒体和移动时代以来，消费者一直在寻找下一股风潮。生成式人工智能很可能就是这样。

作为一个特别令人兴奋的例子，MidJourney以2亿至3亿美元的资金突然出现，并且考虑到它拥有一个小团队（40-60人取决于你问的是谁），它应该是非常有利可图的。

以下是一些有趣的领域：

搜索：几十年来，谷歌的搜索垄断首次出现了一些早期但可靠的竞争对手。像Perplexity AI和You.com这样的初创公司正在引领着从搜索引擎到答案引擎的进化。
人工智能伴侣：除了反乌托邦的方面，如果每个人都有一个无限耐心和乐于助人的伴侣，可以满足人们的特定需求，无论是在知识、娱乐还是治疗方面
人工智能硬件：Humane、Rabbit、VisionPro都是令人兴奋的消费级硬件
超个性化娱乐：随着生成式人工智能工具变得越来越好（也越来越便宜），我们将发明哪些新的娱乐和艺术形式？

人工智能和区块链：胡扯，还是令人兴奋？

我知道，我知道。人工智能和加密货币的交集感觉像是X/Twitter笑话的完美素材。

然而，不可否认的担忧是，人工智能正在集中在少数拥有最多计算、数据和人工智能人才的公司中——从大型科技公司到著名的不开放的OpenAI。与此同时，区块链主张的核心是创建分散的网络，允许参与者共享资源和资产。那里有探索的沃土，这是我们多年前就开始探索的话题（演讲）。

一些与人工智能相关的加密项目经历了明显的加速，包括Bittensor*（去中心化机器智能平台）、Render（去中心化GPU渲染平台）、Arweave（去中心化数据平台）。

虽然我们没有在今年的MAD景观中包括加密部分，但这是一个值得关注的有趣领域。

现在，和往常一样，问题是加密行业是否能够自救，而不是沦为数百个与人工智能相关的模币、抽水和倾销计划和骗局。

第三部分：融资、并购和IPO

融资

目前的融资环境是「两个市场的故事」之一，既有人工智能，也有其他一切。

总体资金继续下滑，2023年下降42%，至2484亿美元。2024年前几个月出现了一些可能的复苏迹象，但到目前为止，趋势或多或少保持不变。

由于上述所有原因，数据基础设施的投资活动很少，只有Sigma Computing和Databricks是少数例外。

显然，人工智能是一个完全不同的故事。

人工智能融资市场不可避免的特点是：

大量资金集中在少数几家初创公司，特别是OpenAI、Anthropic、Inflection AI、Mistral等。

企业投资者的活跃程度过高。2023年最活跃的三大人工智能投资者是微软、谷歌和英伟达。

在上述公司交易中，多少是实际现金，多少是「计算权益」的问题有些模糊。

自2023年MAD以来，以下是一些值得注意的交易，按大致时间顺序排列（并非详尽的列表！）：

基础模型开发商OpenAI在两轮融资中融资103亿美元，目前估值为860亿美元；另一家基础模型开发商Adept融资3.5亿美元，估值10亿美元；金融服务市场研究平台AlphaSense两轮融资4.75亿美元，目前估值25亿美元；另一家基础模型开发商Anthropic三轮融资64.5亿美元，估值184亿美元；矢量数据库平台Pinecone融资1亿美元，估值7.5亿美元；用于存储和计算的光学互连技术平台Celestial AI在两轮融资中筹集了2.75亿美元；GPU云提供商CoreWeave融资4.21亿美元，估值25亿美元；光计算芯片开发商Lightmatter在两轮融资中筹集了3.08亿美元，目前估值为12亿美元；云托管数据分析平台Sigma Computing融资3.4亿美元，估值11亿美元；另一家基础模型开发商Inflection融资13亿美元，估值为40亿美元；Mistral是一家基础模型开发商，两轮融资5.28亿美元，目前估值为20亿美元；Cohere是一家基础模型开发商，以20亿美元的估值融资2.7亿美元；生成视频模型开发商Runway融资1.91亿美元，估值15亿美元；面向企业的视频生成平台synthesis *融资9000万美元，估值10亿美元；用于使用开源模型的机器学习和数据科学平台hug Face融资2.35亿美元，估值45亿美元；专门从事代码生成和软件开发的基础模型开发公司Poolside融资1.26亿美元；人工智能开发平台Modular融资1亿美元，估值6亿美元；人工智能代理开发商Imbue融资2.12亿美元；数据、分析和人工智能解决方案提供商Databricks融资6.84亿美元，估值432亿美元；另一家基础模型开发商Aleph Alpha筹集了4.86亿美元；基础模型开发公司AI21 Labs融资2.08亿美元，估值14亿美元；一个用于生成式人工智能开发的云平台，在两轮融资中筹集了2.085亿美元，目前估值为12.5亿美元；深度学习数据平台VAST Data融资1.18亿美元，估值91亿美元；航空航天和国防工业人工智能试点开发商Shield AI融资5亿美元，估值28亿美元；01.ai，基础模型开发公司AI融资2亿美元，估值10亿美元；航空航天和国防精密零部件工厂制造商哈德良（Hadrian）筹集了1.17亿美元；客户服务/体验人工智能聊天机器人开发商Sierra AI在两轮融资中获得1.1亿美元；人工智能企业搜索平台Lean融资2亿美元，估值22亿美元；GPU云提供商Lambda Labs融资3.2亿美元，估值15亿美元；Magic是一家代码生成和软件开发的基础模型开发公司，以5亿美元的估值融资1.17亿美元。

并购，私有化

自2023年以来，并购市场一直相当平静。

许多传统的软件收购者关注的是他们自己的股票价格和整体业务，而不是积极寻找收购机会。

特别严格的反垄断环境使得潜在收购者的处境更加棘手。

私人股本公司一直相当活跃，在更为艰难的市场中寻求低价机会。

一些值得注意的交易涉及多年来在MAD领域出现的公司（按规模排序）：

半导体制造商博通以690亿美元收购了云计算公司VMWare；网络和安全基础设施公司思科（Cisco）以280亿美元收购了监控和可观察平台Splunk；客户体验管理公司Qualtrics被银湖（Silver Lake）和CPP Investments以125亿美元收购；支出管理平台Coupa被Thoma Bravo以80亿美元私有化；监测和观察平台New Relic被Francisco Partners和TPG以65亿美元收购；数据分析平台Alteryx被Clearlake CAPItal和Insight Partners以44亿美元收购；营收编排平台Salesloft被Vista Equity以23亿美元收购，后者随后又收购了面向客户体验的人工智能聊天机器人开发商Drift；数据湖提供商Databricks以13亿美元收购了人工智能开发平台MosaicML（以及其他几家公司，收购金额较低，如Arcion和Okera）；数据分析平台Thoughtspot以2亿美元收购了商业智能初创公司Mode analytics；数据仓库提供商Snowflake（Snowflake）以1.5亿美元收购了消费者人工智能搜索引擎Neeva；云托管提供商DigitalOcean以1.11亿美元收购了云计算和人工智能开发初创公司Paperspace；云计算芯片制造商英伟达收购了面向边缘的人工智能/机器学习优化平台OmniML。

当然，还有微软对Inflection AI的「非收购收购」。

2024年将是人工智能并购之年吗？这在很大程度上取决于市场的持续势头。

在低端市场，许多拥有强大团队的年轻人工智能初创公司在过去12-18个月内获得了融资。在过去十年的最后几个人工智能Hype Cycle中，很多收购都发生在最初的融资周期之后——通常的价格似乎与这些公司的实际吸引力不成比例，但人工智能人才一直很少见，今天也没有太大不同。

在高端市场，领先的数据平台和领先的人工智能平台之间的进一步融合有着强大的商业理由。不过，这些交易的成本可能要高得多。

首次公开发行（IPO）？

在公开市场，人工智能一直是一个热门趋势。「美股七雄」股票（英伟达、Meta、亚马逊、微软、Alphabet、苹果和特斯拉）在2023年至少上涨了49%，推动了整个股市的上涨。

总体而言，公开市场上仍然严重缺乏纯粹的人工智能股票。为数不多的几家公司获得了丰厚的回报——Palantir的股价在2023年上涨了167%。

这对所有与人工智能相关的pre-IPO初创公司来说应该是个好兆头。在人工智能领域有很多规模相当大的公司——首先是Databricks，但也有许多其他公司，包括Celonis、scale AI、Dataiku*或Fivetran。

还有一个有趣的问题，OpenAI和Anthropic将如何看待公开市场。

与此同时，就IPO而言，2023年是非常糟糕的一年。只有少数与MAD相关的公司上市：营销自动化平台Klaviyo在2023年9月以92亿美元的估值上市（参见我们对Klaviyo S-1的拆分）；论坛式社交网络平台Reddit（将其内容授权给人工智能玩家）于2024年3月上市，估值为64亿美元；为人工智能和云基础设施提供智能连接的半导体公司Astera Labs于2024年3月以55亿美元的估值上市。

我们生活在一个非常特殊的时代。我们正处于范式转变的早期阶段。是时候尝试新事物了。我们才刚刚开始。

来源：mattturck.com

翻译：Fred

这篇关于全速前进：2024年MAD（机器学习，人工智能和数据）前景（20000字长文）的文章就介绍到这儿，希望我们推荐的文章对编程师们有所帮助！