Apple加速AI大跃进:最新发布的MM1 模型论文

2024-03-19 22:36

本文主要是介绍Apple加速AI大跃进:最新发布的MM1 模型论文,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

  每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领域的领跑者。点击订阅,与未来同行! 订阅:https://rengongzhineng.io/

苹果似乎在大型语言模型(LLM)的领域里来得有点晚,跟谷歌、微软和Meta在打造强大的AI工具方面有些距离,但看起来它正在迅速追赶。

今年早些时候,CEO蒂姆·库克告诉投资者,将会有关于AI的重大宣布,这将是一个“重大突破”。许多人猜测这将是一个新版的Siri,由与谷歌的助手更换为双子星类似的LLM驱动。

苹果的研究人员刚刚揭示了这个下一代Siri的可能基础的细节,如果传言属实,它可以在iPhone上与双子星并行工作,提供选择。

作为一篇预印研究论文发布的MM1,本质上提供了一种使用AI生成的数据和标签来加速新模型训练的新方法——包括可能的Siri 2.0。

MM1的核心是一种使用合成数据(包括图像和文本)训练多模态模型的新方法。MM1的研究者声称,他们的新方法加快了性能,并减少了获得所需结果所需的后续提示次数。能够改善提示理解,并尽可能少地与AI互动就得到所需输出,对于消费技术来说是完美的,特别是在将由各种技术能力的人群使用的Siri中。

这些模型在预训练指标上达到了最先进的水平,并在微调后在多模态基准测试上表现出竞争力。MM1似乎是一个AI模型家族,最大的模型大约有300亿个参数。这比GPT-4和Claude 3 Opus中的万亿以上参数要小得多,但研究者仍然声称由于效率提高而达到关键基准。这一突破性成就特别体现在视觉方面,尤其是对图像和其他视觉内容的分析能力以及理解输出的能力。我最近测试了ChatGPT、Claude和双子星在这项任务上的表现如何。

MM1使用不同于其他模型的架构,包括更高分辨率的图像编码器,采用了不同的预训练和标注方法,并专注于使用数据混合来提高单一提示的总体性能。

它还使用了一种混合专家(MoE)模型来在保持处理要求低的同时扩大规模,这进一步暗示了它在iPhone或笔记本电脑等设备上的潜在用途,而不是在云中运行。

苹果是否会用MM1驱动Siri 2.0?尽管这篇论文没有提到Siri或任何潜在产品,但对性能和效率的关注、实现最少提示下的稳定结果以及对广泛多模态能力的需求确实暗示了苹果未来可能会如何发展Siri。由于苹果长期以来的隐私立场,许多LLM驱动的Siri的功能可能必须“在设备上”运行,特别是处理个人信息方面。能够开发一个非常强大的模型,能够从与用户的互动中学习,并且足够小到可以在iPhone上运行,这是一个重大进步。

随着最近的消息称苹果可能会将双子星带到iPhone上,以及之前的传言称公司也在与ChatGPT制造商OpenAI进行谈判,看起来苹果正在采取多方面的方法来实现库克向投资者承诺的AI“大爆炸”。

这篇关于Apple加速AI大跃进:最新发布的MM1 模型论文的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/827446

相关文章

PyCharm接入DeepSeek实现AI编程的操作流程

《PyCharm接入DeepSeek实现AI编程的操作流程》DeepSeek是一家专注于人工智能技术研发的公司,致力于开发高性能、低成本的AI模型,接下来,我们把DeepSeek接入到PyCharm中... 目录引言效果演示创建API key在PyCharm中下载Continue插件配置Continue引言

Golang的CSP模型简介(最新推荐)

《Golang的CSP模型简介(最新推荐)》Golang采用了CSP(CommunicatingSequentialProcesses,通信顺序进程)并发模型,通过goroutine和channe... 目录前言一、介绍1. 什么是 CSP 模型2. Goroutine3. Channel4. Channe

Ubuntu系统怎么安装Warp? 新一代AI 终端神器安装使用方法

《Ubuntu系统怎么安装Warp?新一代AI终端神器安装使用方法》Warp是一款使用Rust开发的现代化AI终端工具,该怎么再Ubuntu系统中安装使用呢?下面我们就来看看详细教程... Warp Terminal 是一款使用 Rust 开发的现代化「AI 终端」工具。最初它只支持 MACOS,但在 20

五大特性引领创新! 深度操作系统 deepin 25 Preview预览版发布

《五大特性引领创新!深度操作系统deepin25Preview预览版发布》今日,深度操作系统正式推出deepin25Preview版本,该版本集成了五大核心特性:磐石系统、全新DDE、Tr... 深度操作系统今日发布了 deepin 25 Preview,新版本囊括五大特性:磐石系统、全新 DDE、Tree

Linux Mint Xia 22.1重磅发布: 重要更新一览

《LinuxMintXia22.1重磅发布:重要更新一览》Beta版LinuxMint“Xia”22.1发布,新版本基于Ubuntu24.04,内核版本为Linux6.8,这... linux Mint 22.1「Xia」正式发布啦!这次更新带来了诸多优化和改进,进一步巩固了 Mint 在 Linux 桌面

多模块的springboot项目发布指定模块的脚本方式

《多模块的springboot项目发布指定模块的脚本方式》该文章主要介绍了如何在多模块的SpringBoot项目中发布指定模块的脚本,作者原先的脚本会清理并编译所有模块,导致发布时间过长,通过简化脚本... 目录多模块的springboot项目发布指定模块的脚本1、不计成本地全部发布2、指定模块发布总结多模

Python基于火山引擎豆包大模型搭建QQ机器人详细教程(2024年最新)

《Python基于火山引擎豆包大模型搭建QQ机器人详细教程(2024年最新)》:本文主要介绍Python基于火山引擎豆包大模型搭建QQ机器人详细的相关资料,包括开通模型、配置APIKEY鉴权和SD... 目录豆包大模型概述开通模型付费安装 SDK 环境配置 API KEY 鉴权Ark 模型接口Prompt

Spring Boot 中整合 MyBatis-Plus详细步骤(最新推荐)

《SpringBoot中整合MyBatis-Plus详细步骤(最新推荐)》本文详细介绍了如何在SpringBoot项目中整合MyBatis-Plus,包括整合步骤、基本CRUD操作、分页查询、批... 目录一、整合步骤1. 创建 Spring Boot 项目2. 配置项目依赖3. 配置数据源4. 创建实体类

Java子线程无法获取Attributes的解决方法(最新推荐)

《Java子线程无法获取Attributes的解决方法(最新推荐)》在Java多线程编程中,子线程无法直接获取主线程设置的Attributes是一个常见问题,本文探讨了这一问题的原因,并提供了两种解决... 目录一、问题原因二、解决方案1. 直接传递数据2. 使用ThreadLocal(适用于线程独立数据)

Ilya-AI分享的他在OpenAI学习到的15个提示工程技巧

Ilya(不是本人,claude AI)在社交媒体上分享了他在OpenAI学习到的15个Prompt撰写技巧。 以下是详细的内容: 提示精确化:在编写提示时,力求表达清晰准确。清楚地阐述任务需求和概念定义至关重要。例:不用"分析文本",而用"判断这段话的情感倾向:积极、消极还是中性"。 快速迭代:善于快速连续调整提示。熟练的提示工程师能够灵活地进行多轮优化。例:从"总结文章"到"用