新火种AI|正面硬刚OpenAI与谷歌？微软竟然偷偷自研出5000亿参数大模型！

本文主要是介绍新火种AI|正面硬刚OpenAI与谷歌？微软竟然偷偷自研出5000亿参数大模型！，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

在AI领域，微软公司一直以其独到的创新性和前瞻性而闻名。也正因此，它抢先在AI赛道嗅到商机，并极具预判性的投资了OpenAI，使其成为自己在AI赛道上的最强助力。不过，微软的野心不止于此。

根据The Information 5月6日的报道，微软公司即将推出一款全新的AI模型产品，内部代号为MAI-1，其参数数量达到了惊人的5000亿。值得一提的是，这款大模型产品由微软独自研发推出。换句话说，微软正式开始了与一众行业巨头的竞争，这其中也包括OpenAI。

微软的独自AI之路，从MAI-1开始...

就在不到一个月前，微软刚推出了一款名为Phi-3的小型AI模型，其中Phi-3 mini被优化至可部署在手机上，拥有38亿参数，经过3.3万亿token的训练，微软称其性能与GPT-3.5等模型相当。

相比之下，MAI-1的规模要大得多，也需要更多的算力投入和训练数据。

MAI-1的出现具有极其重要的意义，它标志着微软在AI领域迈进了一大步，并且开始执行与谷歌和OpenAI等公司竞争的战略举措。

MAI-1的开发由前谷歌AI领导人，Inflection前首席执行官Mustafa Suleyman领导。选择一个“外人”来领导项目，这表明微软正在努力扩大其AI能力，减少对外部合作伙伴，特别是对OpenAI的依赖。

MAI-1具备庞大的参数数量，拥有约5000亿个参数，远超微软此前训练的任何一个开源模型。这个参数规模意味着MAI-1能够处理极其复杂的任务，并且很有可能在性能上与谷歌的Gemini 1.5，Anthropic的Claude 3以及OpenAI的GPT-4等知名大模型相匹敌。为了支持MAI-1的开发，微软已经配置了大量包含英伟达GPU在内的服务器集群，并从各类来源收集训练数据。

不过，也有人对MAI-1的原创性产生了怀疑。就在今年3月，微软刚刚领投完Infection的最新一轮融资。在此之后，微软便从Infection挖走了包括Mustafa Suleyman在内的两位联合创始人以及部分员工。有知情人士透露，微软为此向Infection支付了超过6.5亿美元。所以，很多人合理怀疑，MAI-1与Inflection的技术高度相似。对此，有微软员工表示，尽管MAI-1可能借鉴了Inflection旗下模型的部分技术，但可以肯定的是，MAI-1是一款全新的大语言模型，远超微软此前训练的任何开源模型。

先前推出的Phi系列模型和最近的MAI-1研发体现出微软要在AI领域采取双重策略的意图：一边为移动设备开发小型本地模型，一边开发由云端支持的更大规模的模型。

亦敌亦友！微软与OpenAI之间的竞争将日益加深。

作为OpenAI背后的大金主，微软曾经为其提供过不遗余力的支持。不过，商场如战场，为了自身利益，今天的亲密伙伴很可能变成明天的对手。想要独立发展AI赛道，这几乎成为了微软的必经之路。

一方面，作为科技大厂，微软急需在AI领域获取技术方面的独立性，这就需要不断减少对外部合作伙伴，尤其是对OpenAI的依赖。也只有这样，才能在AI领域拥有更多的自主权和技术控制力。

另一方面，微软进驻AI赛道进行角力，势必是奔着头部的位置去的，也势必对AI行业的战略布局与市场主导地位抱有追求。自研出MAI-1，使得微软能够在大型语言模型领域获取优势，与其他包括谷歌，OpenAI在内的科技巨头形成了平起平坐的竞争关系。

更重要的是，微软早已开始进行投资与资源积累，如今的MAI-1正是水到渠成的结果。譬如早早进行规划，大量囤积AI芯片；未来几年将在GPU和数据中心上进行巨额投资等，都说明微软在AI领域的布局和努力是长线的，基于这些准备，微软做出MAI-1也就成了情理之中的事情。

那么，MAI的出现会成为微软与OpenAI分道扬镳，乃至撕破脸决裂的关键节点吗？倒也未必。

首先，二者的产品存在着明显的差异化。所以，微软想做的，很可能是通过MAI-1提供与OpenAI不同的功能或服务，以此来吸引更多的用户和市场。

此外，从某种程度上说，微软大力研发MAI的行为是对内部争议的回应。根据微软内部人士透露，公司中的一些领导对于原先的AI战略表示不满，认为其过于关注与OpenAI的合作关系，导致对AI原创研究的预算减少。MAI-1的开发可能是对这种内部不满的回应，并且成为了推动公司内部创新和研发的动力。

当前人工智能行业竞争日趋激烈，马上就要成为名副其实的红海。微软此时推出MAI-1，恰恰是对行业竞争态势进行响应，并展现出自己积极入局的决心。因为MAI-1并不是一个单纯的AI大模型，微软推出它，所追求的深层原因有很多，包括追求技术独立性，增强市场竞争力，长期投资与资源积累，产品差异，内部研发动力，战略转移等等。