微软发布功能强大的全新 Phi-3.5 机型,击败谷歌、OpenAI 等公司

本文主要是介绍微软发布功能强大的全新 Phi-3.5 机型,击败谷歌、OpenAI 等公司,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

在这里插入图片描述
微软并没有因为与 OpenAI 的合作而满足于其在人工智能领域的成功。 相反,这家因总部位于华盛顿州而被称为雷德蒙德(Redmond)的公司今天发布了其不断发展的语言/多模态人工智能 Phi 系列中的 3 个新模型。这三个模型分别针对基本/快速推理、更强大的推理和视觉(图像和视频分析)任务而设计。

这三个模型都允许开发者在Hugging Face上下载、使用和微调,并采用微软的MIT许可,允许商业使用和无限制修改。 令人惊讶的是,这三个模型在一些第三方基准测试中的性能也接近最先进水平,甚至在某些情况下击败了其他人工智能提供商,包括谷歌的Gemini 1.5 Flash、Meta的Llama 3.1,甚至OpenAI的GPT-4o。

在这里插入图片描述

Phi-3.5 Mini Instruct: 为计算受限环境而优化

Phi-3.5 Mini Instruct 模型是一款拥有 38 亿个参数的轻量级人工智能模型,专为遵守指令而设计,支持 128k 标记上下文长度。 该模型非常适合在内存或计算受限环境中需要强大推理能力的场景,包括代码生成、数学问题求解和逻辑推理等任务。

尽管体积小巧,Phi-3.5 Mini Instruct 模型在多语言和多轮会话任务中表现出了极具竞争力的性能,与前代产品相比有了显著改进。 它在多项基准测试中的性能接近最先进水平,并在衡量 "长上下文代码理解 "的 RepoQA 基准测试中超越了其他类似尺寸的模型(Llama-3.1-8B-instruct 和 Mistral-7B-instruct)。

在这里插入图片描述

Phi-3.5 MoE: 微软的 “专家混合物”

Phi-3.5 MoE(专家混合物)模型似乎是该公司推出的第一个模型类别,它将多种不同的模型类型整合到一个模型中,每种模型都擅长不同的任务。 该模型利用具有 420 亿个活动参数的架构,支持 128k 标记上下文长度,为要求苛刻的应用提供可扩展的人工智能性能。 Phi-3.5 MoE 专为各种推理任务而设计,在代码、数学和多语言语言理解方面表现出色,在特定基准测试(包括 RepoQA)中的表现往往优于大型模型:

在这里插入图片描述
此外,在科技、人文和社会科学等学科的 5 次 MMLU(大规模多任务语言理解)测试中,它也在不同的专业水平上击败了 GPT-4o mini,令人印象深刻。

在这里插入图片描述
MoE 模型的独特架构使其能够在处理跨多种语言的复杂人工智能任务时保持高效。

Phi-3.5 Vision Instruct: 高级多模态推理

Phi-3.5 Vision Instruct 模型将文本和图像处理功能整合在一起,完成了三重奏。 这种多模态模型特别适用于一般图像理解、光学字符识别、图表和表格理解以及视频摘要等任务。

与 Phi-3.5 系列中的其他模型一样,Vision Instruct 支持 128k 标记上下文长度,使其能够管理复杂的多帧视觉任务。 微软强调,该模型的训练结合了合成数据集和经过过滤的公开数据集,侧重于高质量、推理密集的数据。

训练新的 Phi 三巨头

Phi-3.5 Mini Instruct 模型使用 512 个 H100-80G GPU,历时 10 天,在 3.4 万亿个代币上进行了训练;Vision Instruct 模型使用 256 个 A100-80G GPU,历时 6 天,在 5000 亿个代币上进行了训练。 Phi-3.5 MoE 模型采用专家混合架构,使用 512 个 H100-80G GPU,历时 23 天,在 4.9 万亿个代币上进行了训练。

MIT 许可下的开放源码

所有三种 Phi-3.5 型号均在 MIT 许可下提供,体现了微软支持开放源码社区的承诺。 该许可允许开发人员自由使用、修改、合并、发布、分发、转授权或出售软件副本。 该许可还包括一项免责声明,即软件按 "原样 "提供,不提供任何形式的保证。 微软和其他版权持有者对因使用该软件而可能产生的任何索赔、损害或其他责任不承担任何责任。 微软发布 Phi-3.5 系列代表着多语言和多模态人工智能的发展向前迈出了重要一步。 通过在开源许可下提供这些模型,微软使开发人员能够将尖端的人工智能功能集成到他们的应用程序中,从而促进商业和研究领域的创新。

这篇关于微软发布功能强大的全新 Phi-3.5 机型,击败谷歌、OpenAI 等公司的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1093673

相关文章

Ilya-AI分享的他在OpenAI学习到的15个提示工程技巧

Ilya(不是本人,claude AI)在社交媒体上分享了他在OpenAI学习到的15个Prompt撰写技巧。 以下是详细的内容: 提示精确化:在编写提示时,力求表达清晰准确。清楚地阐述任务需求和概念定义至关重要。例:不用"分析文本",而用"判断这段话的情感倾向:积极、消极还是中性"。 快速迭代:善于快速连续调整提示。熟练的提示工程师能够灵活地进行多轮优化。例:从"总结文章"到"用

高效+灵活,万博智云全球发布AWS无代理跨云容灾方案!

摘要 近日,万博智云推出了基于AWS的无代理跨云容灾解决方案,并与拉丁美洲,中东,亚洲的合作伙伴面向全球开展了联合发布。这一方案以AWS应用环境为基础,将HyperBDR平台的高效、灵活和成本效益优势与无代理功能相结合,为全球企业带来实现了更便捷、经济的数据保护。 一、全球联合发布 9月2日,万博智云CEO Michael Wong在线上平台发布AWS无代理跨云容灾解决方案的阐述视频,介绍了

4B参数秒杀GPT-3.5:MiniCPM 3.0惊艳登场!

​ 面壁智能 在 AI 的世界里,总有那么几个时刻让人惊叹不已。面壁智能推出的 MiniCPM 3.0,这个仅有4B参数的"小钢炮",正在以惊人的实力挑战着 GPT-3.5 这个曾经的AI巨人。 MiniCPM 3.0 MiniCPM 3.0 MiniCPM 3.0 目前的主要功能有: 长上下文功能:原生支持 32k 上下文长度,性能完美。我们引入了

Vue3项目开发——新闻发布管理系统(六)

文章目录 八、首页设计开发1、页面设计2、登录访问拦截实现3、用户基本信息显示①封装用户基本信息获取接口②用户基本信息存储③用户基本信息调用④用户基本信息动态渲染 4、退出功能实现①注册点击事件②添加退出功能③数据清理 5、代码下载 八、首页设计开发 登录成功后,系统就进入了首页。接下来,也就进行首页的开发了。 1、页面设计 系统页面主要分为三部分,左侧为系统的菜单栏,右侧

maven发布项目到私服-snapshot快照库和release发布库的区别和作用及maven常用命令

maven发布项目到私服-snapshot快照库和release发布库的区别和作用及maven常用命令 在日常的工作中由于各种原因,会出现这样一种情况,某些项目并没有打包至mvnrepository。如果采用原始直接打包放到lib目录的方式进行处理,便对项目的管理带来一些不必要的麻烦。例如版本升级后需要重新打包并,替换原有jar包等等一些额外的工作量和麻烦。为了避免这些不必要的麻烦,通常我们

禅道Docker安装包发布

禅道Docker安装包发布 大家好, 禅道Docker安装包发布。 一、下载地址 禅道开源版:   /dl/zentao/docker/docker_zentao.zip  备用下载地址:https://download.csdn.net/download/u013490585/16271485 数据库用户名: root,默认密码: 123456。运行时,可以设置 MYSQL_ROOT_P

微软正式推出 Spartan 斯巴达浏览器

作为用于替代 IE 浏览器的下一代继任者,微软的 Project Spartan 斯巴达浏览器可算是吊足了玩家们的胃口!如今,在最新的 Windows 10 Build 10049 版本起,它终于正式登场了。 斯巴达浏览器搭载了全新的渲染引擎、新的用户界面并集成了 Cortana 语音助手。功能上新增了稍后阅读列表、阅读视图、F12开发者工具、支持网页注释 (手写涂鸦),可以保存到 O

创业者该如何设计公司的股权架构

本文来自七八点联合IT橘子和车库咖啡的一系列关于设计公司股权结构的讲座。 主讲人何德文: 在公司发展的不同阶段,创业者都会面临公司股权架构设计问题: 1.合伙人合伙创业第一天,就会面临股权架构设计问题(合伙人股权设计); 2.公司早期要引入天使资金,会面临股权架构设计问题(天使融资); 3.公司有三五十号人,要激励中层管理与重要技术人员和公司长期走下去,会面临股权架构设计问题(员工股权激

安卓玩机工具------小米工具箱扩展工具 小米机型功能拓展

小米工具箱扩展版                     小米工具箱扩展版 iO_Box_Mi_Ext是由@晨钟酱开发的一款适用于小米(MIUI)、多亲(2、2Pro)、多看(多看电纸书)的多功能工具箱。该工具所有功能均可以免root实现,使用前,请打开开发者选项中的“USB调试”  功能特点 【小米工具箱】 1:冻结MIUI全家桶,隐藏状态栏图标,修改下拉通知栏图块数量;冻结

全英文地图/天地图和谷歌瓦片地图杂交/设备分布和轨迹回放/无需翻墙离线使用

一、前言说明 随着风云局势的剧烈变化,对我们搞软件开发的人员来说,影响也是越发明显,比如之前对美对欧的软件居多,现在慢慢的变成了对大鹅和中东以及非洲的居多,这两年明显问有没有俄语或者阿拉伯语的输入法的增多,这要是放在2019年以前,一年也遇不到一个人问这种需求场景的。 地图应用这块也是,之前的应用主要在国内,现在慢慢的多了一些外国的应用场景,这就遇到一个大问题,我们平时主要开发用的都是国内的地