Apple加速AI大跃进:最新发布的MM1 模型论文

2024-03-19 22:36

本文主要是介绍Apple加速AI大跃进:最新发布的MM1 模型论文,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

  每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领域的领跑者。点击订阅,与未来同行! 订阅:https://rengongzhineng.io/

苹果似乎在大型语言模型(LLM)的领域里来得有点晚,跟谷歌、微软和Meta在打造强大的AI工具方面有些距离,但看起来它正在迅速追赶。

今年早些时候,CEO蒂姆·库克告诉投资者,将会有关于AI的重大宣布,这将是一个“重大突破”。许多人猜测这将是一个新版的Siri,由与谷歌的助手更换为双子星类似的LLM驱动。

苹果的研究人员刚刚揭示了这个下一代Siri的可能基础的细节,如果传言属实,它可以在iPhone上与双子星并行工作,提供选择。

作为一篇预印研究论文发布的MM1,本质上提供了一种使用AI生成的数据和标签来加速新模型训练的新方法——包括可能的Siri 2.0。

MM1的核心是一种使用合成数据(包括图像和文本)训练多模态模型的新方法。MM1的研究者声称,他们的新方法加快了性能,并减少了获得所需结果所需的后续提示次数。能够改善提示理解,并尽可能少地与AI互动就得到所需输出,对于消费技术来说是完美的,特别是在将由各种技术能力的人群使用的Siri中。

这些模型在预训练指标上达到了最先进的水平,并在微调后在多模态基准测试上表现出竞争力。MM1似乎是一个AI模型家族,最大的模型大约有300亿个参数。这比GPT-4和Claude 3 Opus中的万亿以上参数要小得多,但研究者仍然声称由于效率提高而达到关键基准。这一突破性成就特别体现在视觉方面,尤其是对图像和其他视觉内容的分析能力以及理解输出的能力。我最近测试了ChatGPT、Claude和双子星在这项任务上的表现如何。

MM1使用不同于其他模型的架构,包括更高分辨率的图像编码器,采用了不同的预训练和标注方法,并专注于使用数据混合来提高单一提示的总体性能。

它还使用了一种混合专家(MoE)模型来在保持处理要求低的同时扩大规模,这进一步暗示了它在iPhone或笔记本电脑等设备上的潜在用途,而不是在云中运行。

苹果是否会用MM1驱动Siri 2.0?尽管这篇论文没有提到Siri或任何潜在产品,但对性能和效率的关注、实现最少提示下的稳定结果以及对广泛多模态能力的需求确实暗示了苹果未来可能会如何发展Siri。由于苹果长期以来的隐私立场,许多LLM驱动的Siri的功能可能必须“在设备上”运行,特别是处理个人信息方面。能够开发一个非常强大的模型,能够从与用户的互动中学习,并且足够小到可以在iPhone上运行,这是一个重大进步。

随着最近的消息称苹果可能会将双子星带到iPhone上,以及之前的传言称公司也在与ChatGPT制造商OpenAI进行谈判,看起来苹果正在采取多方面的方法来实现库克向投资者承诺的AI“大爆炸”。

这篇关于Apple加速AI大跃进:最新发布的MM1 模型论文的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/827446

相关文章

Nginx实现前端灰度发布

《Nginx实现前端灰度发布》灰度发布是一种重要的策略,它允许我们在不影响所有用户的情况下,逐步推出新功能或更新,通过灰度发布,我们可以测试新版本的稳定性和性能,下面就来介绍一下前端灰度发布的使用,感... 目录前言一、基于权重的流量分配二、基于 Cookie 的分流三、基于请求头的分流四、基于请求参数的分

Mysql中InnoDB与MyISAM索引差异详解(最新整理)

《Mysql中InnoDB与MyISAM索引差异详解(最新整理)》InnoDB和MyISAM在索引实现和特性上有差异,包括聚集索引、非聚集索引、事务支持、并发控制、覆盖索引、主键约束、外键支持和物理存... 目录1. 索引类型与数据存储方式InnoDBMyISAM2. 事务与并发控制InnoDBMyISAM

Redis 内存淘汰策略深度解析(最新推荐)

《Redis内存淘汰策略深度解析(最新推荐)》本文详细探讨了Redis的内存淘汰策略、实现原理、适用场景及最佳实践,介绍了八种内存淘汰策略,包括noeviction、LRU、LFU、TTL、Rand... 目录一、 内存淘汰策略概述二、内存淘汰策略详解2.1 ​noeviction(不淘汰)​2.2 ​LR

StarRocks索引详解(最新整理)

《StarRocks索引详解(最新整理)》StarRocks支持多种索引类型,包括主键索引、前缀索引、Bitmap索引和Bloomfilter索引,这些索引类型适用于不同场景,如唯一性约束、减少索引空... 目录1. 主键索引(Primary Key Index)2. 前缀索引(Prefix Index /

Spring AI集成DeepSeek三步搞定Java智能应用的详细过程

《SpringAI集成DeepSeek三步搞定Java智能应用的详细过程》本文介绍了如何使用SpringAI集成DeepSeek,一个国内顶尖的多模态大模型,SpringAI提供了一套统一的接口,简... 目录DeepSeek 介绍Spring AI 是什么?Spring AI 的主要功能包括1、环境准备2

Spring AI集成DeepSeek实现流式输出的操作方法

《SpringAI集成DeepSeek实现流式输出的操作方法》本文介绍了如何在SpringBoot中使用Sse(Server-SentEvents)技术实现流式输出,后端使用SpringMVC中的S... 目录一、后端代码二、前端代码三、运行项目小天有话说题外话参考资料前面一篇文章我们实现了《Spring

Spring AI与DeepSeek实战一之快速打造智能对话应用

《SpringAI与DeepSeek实战一之快速打造智能对话应用》本文详细介绍了如何通过SpringAI框架集成DeepSeek大模型,实现普通对话和流式对话功能,步骤包括申请API-KEY、项目搭... 目录一、概述二、申请DeepSeek的API-KEY三、项目搭建3.1. 开发环境要求3.2. mav

C#集成DeepSeek模型实现AI私有化的流程步骤(本地部署与API调用教程)

《C#集成DeepSeek模型实现AI私有化的流程步骤(本地部署与API调用教程)》本文主要介绍了C#集成DeepSeek模型实现AI私有化的方法,包括搭建基础环境,如安装Ollama和下载DeepS... 目录前言搭建基础环境1、安装 Ollama2、下载 DeepSeek R1 模型客户端 ChatBo

SpringBoot快速接入OpenAI大模型的方法(JDK8)

《SpringBoot快速接入OpenAI大模型的方法(JDK8)》本文介绍了如何使用AI4J快速接入OpenAI大模型,并展示了如何实现流式与非流式的输出,以及对函数调用的使用,AI4J支持JDK8... 目录使用AI4J快速接入OpenAI大模型介绍AI4J-github快速使用创建SpringBoot

Python爬虫selenium验证之中文识别点选+图片验证码案例(最新推荐)

《Python爬虫selenium验证之中文识别点选+图片验证码案例(最新推荐)》本文介绍了如何使用Python和Selenium结合ddddocr库实现图片验证码的识别和点击功能,感兴趣的朋友一起看... 目录1.获取图片2.目标识别3.背景坐标识别3.1 ddddocr3.2 打码平台4.坐标点击5.图