新火种AI|正面硬刚OpenAI与谷歌?微软竟然偷偷自研出5000亿参数大模型!

本文主要是介绍新火种AI|正面硬刚OpenAI与谷歌?微软竟然偷偷自研出5000亿参数大模型!,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

在AI领域,微软公司一直以其独到的创新性和前瞻性而闻名。也正因此,它抢先在AI赛道嗅到商机,并极具预判性的投资了OpenAI,使其成为自己在AI赛道上的最强助力。不过,微软的野心不止于此。

根据The Information 5月6日的报道,微软公司即将推出一款全新的AI模型产品,内部代号为MAI-1,其参数数量达到了惊人的5000亿。值得一提的是,这款大模型产品由微软独自研发推出。换句话说,微软正式开始了与一众行业巨头的竞争,这其中也包括OpenAI。

微软的独自AI之路,从MAI-1开始...

就在不到一个月前,微软刚推出了一款名为Phi-3的小型AI模型,其中Phi-3 mini被优化至可部署在手机上,拥有38亿参数,经过3.3万亿token的训练,微软称其性能与GPT-3.5等模型相当。

相比之下,MAI-1的规模要大得多,也需要更多的算力投入和训练数据

MAI-1的出现具有极其重要的意义,它标志着微软在AI领域迈进了一大步,并且开始执行与谷歌和OpenAI等公司竞争的战略举措。

MAI-1的开发由前谷歌AI领导人,Inflection前首席执行官Mustafa Suleyman领导。选择一个“外人”来领导项目,这表明微软正在努力扩大其AI能力,减少对外部合作伙伴,特别是对OpenAI的依赖。

MAI-1具备庞大的参数数量,拥有约5000亿个参数,远超微软此前训练的任何一个开源模型。这个参数规模意味着MAI-1能够处理极其复杂的任务,并且很有可能在性能上与谷歌的Gemini 1.5,Anthropic的Claude 3以及OpenAI的GPT-4等知名大模型相匹敌。为了支持MAI-1的开发,微软已经配置了大量包含英伟达GPU在内的服务器集群,并从各类来源收集训练数据。

不过,也有人对MAI-1的原创性产生了怀疑。就在今年3月,微软刚刚领投完Infection的最新一轮融资。在此之后,微软便从Infection挖走了包括Mustafa Suleyman在内的两位联合创始人以及部分员工。有知情人士透露,微软为此向Infection支付了超过6.5亿美元。所以,很多人合理怀疑,MAI-1与Inflection的技术高度相似。对此,有微软员工表示,尽管MAI-1可能借鉴了Inflection旗下模型的部分技术,但可以肯定的是,MAI-1是一款全新的大语言模型,远超微软此前训练的任何开源模型

先前推出的Phi系列模型和最近的MAI-1研发体现出微软要在AI领域采取双重策略的意图:一边为移动设备开发小型本地模型,一边开发由云端支持的更大规模的模型

亦敌亦友!微软与OpenAI之间的竞争将日益加深。

作为OpenAI背后的大金主,微软曾经为其提供过不遗余力的支持。不过,商场如战场,为了自身利益,今天的亲密伙伴很可能变成明天的对手。想要独立发展AI赛道,这几乎成为了微软的必经之路。

一方面,作为科技大厂,微软急需在AI领域获取技术方面的独立性,这就需要不断减少对外部合作伙伴,尤其是对OpenAI的依赖。也只有这样,才能在AI领域拥有更多的自主权和技术控制力。

另一方面,微软进驻AI赛道进行角力,势必是奔着头部的位置去的,也势必对AI行业的战略布局与市场主导地位抱有追求。自研出MAI-1,使得微软能够在大型语言模型领域获取优势,与其他包括谷歌,OpenAI在内的科技巨头形成了平起平坐的竞争关系。

更重要的是,微软早已开始进行投资与资源积累,如今的MAI-1正是水到渠成的结果。譬如早早进行规划,大量囤积AI芯片;未来几年将在GPU和数据中心上进行巨额投资等,都说明微软在AI领域的布局和努力是长线的,基于这些准备,微软做出MAI-1也就成了情理之中的事情。

那么,MAI的出现会成为微软与OpenAI分道扬镳,乃至撕破脸决裂的关键节点吗?倒也未必。

首先,二者的产品存在着明显的差异化。所以,微软想做的,很可能是通过MAI-1提供与OpenAI不同的功能或服务,以此来吸引更多的用户和市场。

此外,从某种程度上说,微软大力研发MAI的行为是对内部争议的回应。根据微软内部人士透露,公司中的一些领导对于原先的AI战略表示不满,认为其过于关注与OpenAI的合作关系,导致对AI原创研究的预算减少。MAI-1的开发可能是对这种内部不满的回应,并且成为了推动公司内部创新和研发的动力。

当前人工智能行业竞争日趋激烈,马上就要成为名副其实的红海。微软此时推出MAI-1,恰恰是对行业竞争态势进行响应,并展现出自己积极入局的决心。因为MAI-1并不是一个单纯的AI大模型,微软推出它,所追求的深层原因有很多,包括追求技术独立性,增强市场竞争力,长期投资与资源积累,产品差异,内部研发动力,战略转移等等。

如今,尽管MA-1的具体应用和性能还有待评估,但毫无疑问,它将成为AI领域的重要竞争者。也正是因为横空出世的MAI-1,我们可以清晰的感知到AI赛道的竞争之激烈,看到了科技巨头之间的激烈厮杀和战略操纵。

这篇关于新火种AI|正面硬刚OpenAI与谷歌?微软竟然偷偷自研出5000亿参数大模型!的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/981168

相关文章

揭秘未来艺术:AI绘画工具全面介绍

📑前言 随着科技的飞速发展,人工智能(AI)已经逐渐渗透到我们生活的方方面面。在艺术创作领域,AI技术同样展现出了其独特的魅力。今天,我们就来一起探索这个神秘而引人入胜的领域,深入了解AI绘画工具的奥秘及其为艺术创作带来的革命性变革。 一、AI绘画工具的崛起 1.1 颠覆传统绘画模式 在过去,绘画是艺术家们通过手中的画笔,蘸取颜料,在画布上自由挥洒的创造性过程。然而,随着AI绘画工

一份LLM资源清单围观技术大佬的日常;手把手教你在美国搭建「百万卡」AI数据中心;为啥大模型做不好简单的数学计算? | ShowMeAI日报

👀日报&周刊合集 | 🎡ShowMeAI官网 | 🧡 点赞关注评论拜托啦! 1. 为啥大模型做不好简单的数学计算?从大模型高考数学成绩不及格说起 司南评测体系 OpenCompass 选取 7 个大模型 (6 个开源模型+ GPT-4o),组织参与了 2024 年高考「新课标I卷」的语文、数学、英语考试,然后由经验丰富的判卷老师评判得分。 结果如上图所

AI儿童绘本创作

之前分享过AI儿童绘画的项目,但是主要问题是角色一致要花费很长的时间! 今天发现了这款,非常奈斯! 只需输入故事主题、风格、模板,软件就会自动创作故事内容,自动生成插画配图,自动根据模板生成成品,测试效果如下图。 变现方式:生成儿童绘本发布到各平台,吸引宝妈群体进私域。  百度网盘 请输入提取码百度网盘为您提供文件的网络备份、同步和分享服务。空间大、速度快、安全

大语言模型(LLMs)能够进行推理和规划吗?

大语言模型(LLMs),基本上是经过强化训练的 n-gram 模型,它们在网络规模的语言语料库(实际上,可以说是我们文明的知识库)上进行了训练,展现出了一种超乎预期的语言行为,引发了我们的广泛关注。从训练和操作的角度来看,LLMs 可以被认为是一种巨大的、非真实的记忆库,相当于为我们所有人提供了一个外部的系统 1(见图 1)。然而,它们表面上的多功能性让许多研究者好奇,这些模型是否也能在通常需要系

ABAP怎么把传入的参数刷新到内表里面呢?

1.在执行相关的功能操作之前,优先执行这一段代码,把输入的数据更新入内表里面 DATA: lo_guid TYPE REF TO cl_gui_alv_grid.CALL FUNCTION 'GET_GLOBALS_FROM_SLVC_FULLSCR'IMPORTINGe_grid = lo_guid.CALL METHOD lo_guid->check_changed_data.CALL M

人工和AI大语言模型成本对比 ai语音模型

这里既有AI,又有生活大道理,无数渺小的思考填满了一生。 上一专题搭建了一套GMM-HMM系统,来识别连续0123456789的英文语音。 但若不是仅针对数字,而是所有普通词汇,可能达到十几万个词,解码过程将非常复杂,识别结果组合太多,识别结果不会理想。因此只有声学模型是完全不够的,需要引入语言模型来约束识别结果。让“今天天气很好”的概率高于“今天天汽很好”的概率,得到声学模型概率高,又符合表达

智能客服到个人助理,国内AI大模型如何改变我们的生活?

引言 随着人工智能(AI)技术的高速发展,AI大模型越来越多地出现在我们的日常生活和工作中。国内的AI大模型在过去几年里取得了显著的进展,不少独创的技术点和实际应用令人瞩目。 那么,国内的AI大模型有哪些独创的技术点?它们在实际应用中又有哪些出色表现呢?此外,普通人又该如何利用这些大模型提升工作和生活的质量和效率呢?本文将为你一一解析。 一、国内AI大模型的独创技术点 多模态学习 多

【新闻】AI程序员要来了吗?阿里云官宣

内容提要 6 月 21 日,在阿里云上海 AI 峰会上,阿里云宣布推出首个AI 程序员。 据介绍,这个AI程序员具备架构师、开发工程师、测试工程师等多种岗位的技能,能一站式自主完成任务分解、代码编写、测试、问题修复、代码提交整个过程,最快分钟级即可完成应用开发,大幅提升研发效率。 近段时间以来,有关AI的实践应用突破不断,全球开发者加速研发步伐。有业内人士坦言,随着大模型性能逐渐提升,AI应

警告,恶意域名疯狂外联,原因竟然是……

前言    在某个风和日丽的下午,突然收到客户那边运维发过来的消息说我司的DTA设备在疯狂告警,说存在恶意域名外联,我急忙背上小背包前往客户现场,经过与客户协同排查,最终确定该事件为一起挖矿病毒引起的恶意域名外联事件。(因客户信息保密且为了保证文章逻辑完整性,部分截图为后期追加图) 事件分析 一看域名地址donate.v2.xmrig.com

OpenCompass:大模型测评工具

大模型相关目录 大模型,包括部署微调prompt/Agent应用开发、知识库增强、数据库增强、知识图谱增强、自然语言处理、多模态等大模型应用开发内容 从0起步,扬帆起航。 大模型应用向开发路径:AI代理工作流大模型应用开发实用开源项目汇总大模型问答项目问答性能评估方法大模型数据侧总结大模型token等基本概念及参数和内存的关系大模型应用开发-华为大模型生态规划从零开始的LLaMA-Factor