新火种AI|正面硬刚OpenAI与谷歌?微软竟然偷偷自研出5000亿参数大模型!

本文主要是介绍新火种AI|正面硬刚OpenAI与谷歌?微软竟然偷偷自研出5000亿参数大模型!,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

在AI领域,微软公司一直以其独到的创新性和前瞻性而闻名。也正因此,它抢先在AI赛道嗅到商机,并极具预判性的投资了OpenAI,使其成为自己在AI赛道上的最强助力。不过,微软的野心不止于此。

根据The Information 5月6日的报道,微软公司即将推出一款全新的AI模型产品,内部代号为MAI-1,其参数数量达到了惊人的5000亿。值得一提的是,这款大模型产品由微软独自研发推出。换句话说,微软正式开始了与一众行业巨头的竞争,这其中也包括OpenAI。

微软的独自AI之路,从MAI-1开始...

就在不到一个月前,微软刚推出了一款名为Phi-3的小型AI模型,其中Phi-3 mini被优化至可部署在手机上,拥有38亿参数,经过3.3万亿token的训练,微软称其性能与GPT-3.5等模型相当。

相比之下,MAI-1的规模要大得多,也需要更多的算力投入和训练数据

MAI-1的出现具有极其重要的意义,它标志着微软在AI领域迈进了一大步,并且开始执行与谷歌和OpenAI等公司竞争的战略举措。

MAI-1的开发由前谷歌AI领导人,Inflection前首席执行官Mustafa Suleyman领导。选择一个“外人”来领导项目,这表明微软正在努力扩大其AI能力,减少对外部合作伙伴,特别是对OpenAI的依赖。

MAI-1具备庞大的参数数量,拥有约5000亿个参数,远超微软此前训练的任何一个开源模型。这个参数规模意味着MAI-1能够处理极其复杂的任务,并且很有可能在性能上与谷歌的Gemini 1.5,Anthropic的Claude 3以及OpenAI的GPT-4等知名大模型相匹敌。为了支持MAI-1的开发,微软已经配置了大量包含英伟达GPU在内的服务器集群,并从各类来源收集训练数据。

不过,也有人对MAI-1的原创性产生了怀疑。就在今年3月,微软刚刚领投完Infection的最新一轮融资。在此之后,微软便从Infection挖走了包括Mustafa Suleyman在内的两位联合创始人以及部分员工。有知情人士透露,微软为此向Infection支付了超过6.5亿美元。所以,很多人合理怀疑,MAI-1与Inflection的技术高度相似。对此,有微软员工表示,尽管MAI-1可能借鉴了Inflection旗下模型的部分技术,但可以肯定的是,MAI-1是一款全新的大语言模型,远超微软此前训练的任何开源模型

先前推出的Phi系列模型和最近的MAI-1研发体现出微软要在AI领域采取双重策略的意图:一边为移动设备开发小型本地模型,一边开发由云端支持的更大规模的模型

亦敌亦友!微软与OpenAI之间的竞争将日益加深。

作为OpenAI背后的大金主,微软曾经为其提供过不遗余力的支持。不过,商场如战场,为了自身利益,今天的亲密伙伴很可能变成明天的对手。想要独立发展AI赛道,这几乎成为了微软的必经之路。

一方面,作为科技大厂,微软急需在AI领域获取技术方面的独立性,这就需要不断减少对外部合作伙伴,尤其是对OpenAI的依赖。也只有这样,才能在AI领域拥有更多的自主权和技术控制力。

另一方面,微软进驻AI赛道进行角力,势必是奔着头部的位置去的,也势必对AI行业的战略布局与市场主导地位抱有追求。自研出MAI-1,使得微软能够在大型语言模型领域获取优势,与其他包括谷歌,OpenAI在内的科技巨头形成了平起平坐的竞争关系。

更重要的是,微软早已开始进行投资与资源积累,如今的MAI-1正是水到渠成的结果。譬如早早进行规划,大量囤积AI芯片;未来几年将在GPU和数据中心上进行巨额投资等,都说明微软在AI领域的布局和努力是长线的,基于这些准备,微软做出MAI-1也就成了情理之中的事情。

那么,MAI的出现会成为微软与OpenAI分道扬镳,乃至撕破脸决裂的关键节点吗?倒也未必。

首先,二者的产品存在着明显的差异化。所以,微软想做的,很可能是通过MAI-1提供与OpenAI不同的功能或服务,以此来吸引更多的用户和市场。

此外,从某种程度上说,微软大力研发MAI的行为是对内部争议的回应。根据微软内部人士透露,公司中的一些领导对于原先的AI战略表示不满,认为其过于关注与OpenAI的合作关系,导致对AI原创研究的预算减少。MAI-1的开发可能是对这种内部不满的回应,并且成为了推动公司内部创新和研发的动力。

当前人工智能行业竞争日趋激烈,马上就要成为名副其实的红海。微软此时推出MAI-1,恰恰是对行业竞争态势进行响应,并展现出自己积极入局的决心。因为MAI-1并不是一个单纯的AI大模型,微软推出它,所追求的深层原因有很多,包括追求技术独立性,增强市场竞争力,长期投资与资源积累,产品差异,内部研发动力,战略转移等等。

如今,尽管MA-1的具体应用和性能还有待评估,但毫无疑问,它将成为AI领域的重要竞争者。也正是因为横空出世的MAI-1,我们可以清晰的感知到AI赛道的竞争之激烈,看到了科技巨头之间的激烈厮杀和战略操纵。

这篇关于新火种AI|正面硬刚OpenAI与谷歌?微软竟然偷偷自研出5000亿参数大模型!的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/981168

相关文章

Deepseek R1模型本地化部署+API接口调用详细教程(释放AI生产力)

《DeepseekR1模型本地化部署+API接口调用详细教程(释放AI生产力)》本文介绍了本地部署DeepSeekR1模型和通过API调用将其集成到VSCode中的过程,作者详细步骤展示了如何下载和... 目录前言一、deepseek R1模型与chatGPT o1系列模型对比二、本地部署步骤1.安装oll

Spring AI Alibaba接入大模型时的依赖问题小结

《SpringAIAlibaba接入大模型时的依赖问题小结》文章介绍了如何在pom.xml文件中配置SpringAIAlibaba依赖,并提供了一个示例pom.xml文件,同时,建议将Maven仓... 目录(一)pom.XML文件:(二)application.yml配置文件(一)pom.xml文件:首

Java通过反射获取方法参数名的方式小结

《Java通过反射获取方法参数名的方式小结》这篇文章主要为大家详细介绍了Java如何通过反射获取方法参数名的方式,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录1、前言2、解决方式方式2.1: 添加编译参数配置 -parameters方式2.2: 使用Spring的内部工具类 -

SpringBoot整合DeepSeek实现AI对话功能

《SpringBoot整合DeepSeek实现AI对话功能》本文介绍了如何在SpringBoot项目中整合DeepSeekAPI和本地私有化部署DeepSeekR1模型,通过SpringAI框架简化了... 目录Spring AI版本依赖整合DeepSeek API key整合本地化部署的DeepSeek

如何在本地部署 DeepSeek Janus Pro 文生图大模型

《如何在本地部署DeepSeekJanusPro文生图大模型》DeepSeekJanusPro模型在本地成功部署,支持图片理解和文生图功能,通过Gradio界面进行交互,展示了其强大的多模态处... 目录什么是 Janus Pro1. 安装 conda2. 创建 python 虚拟环境3. 克隆 janus

本地私有化部署DeepSeek模型的详细教程

《本地私有化部署DeepSeek模型的详细教程》DeepSeek模型是一种强大的语言模型,本地私有化部署可以让用户在自己的环境中安全、高效地使用该模型,避免数据传输到外部带来的安全风险,同时也能根据自... 目录一、引言二、环境准备(一)硬件要求(二)软件要求(三)创建虚拟环境三、安装依赖库四、获取 Dee

DeepSeek模型本地部署的详细教程

《DeepSeek模型本地部署的详细教程》DeepSeek作为一款开源且性能强大的大语言模型,提供了灵活的本地部署方案,让用户能够在本地环境中高效运行模型,同时保护数据隐私,在本地成功部署DeepSe... 目录一、环境准备(一)硬件需求(二)软件依赖二、安装Ollama三、下载并部署DeepSeek模型选

PyCharm接入DeepSeek实现AI编程的操作流程

《PyCharm接入DeepSeek实现AI编程的操作流程》DeepSeek是一家专注于人工智能技术研发的公司,致力于开发高性能、低成本的AI模型,接下来,我们把DeepSeek接入到PyCharm中... 目录引言效果演示创建API key在PyCharm中下载Continue插件配置Continue引言

Python调用另一个py文件并传递参数常见的方法及其应用场景

《Python调用另一个py文件并传递参数常见的方法及其应用场景》:本文主要介绍在Python中调用另一个py文件并传递参数的几种常见方法,包括使用import语句、exec函数、subproce... 目录前言1. 使用import语句1.1 基本用法1.2 导入特定函数1.3 处理文件路径2. 使用ex

Golang的CSP模型简介(最新推荐)

《Golang的CSP模型简介(最新推荐)》Golang采用了CSP(CommunicatingSequentialProcesses,通信顺序进程)并发模型,通过goroutine和channe... 目录前言一、介绍1. 什么是 CSP 模型2. Goroutine3. Channel4. Channe