熬夜看完苹果发布会记下五条笔记:Siri的涅槃重生,OpenAI成最大赢家

本文主要是介绍熬夜看完苹果发布会记下五条笔记:Siri的涅槃重生,OpenAI成最大赢家,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

你好,我是悦创。

北京时间6月11日凌晨1点,也就是几个小时之前,苹果公司召开了自己今年的开发者大会 WWDC,其中推出了堪称苹果十年来最大的一次版本更新——iOS18。当然,我敢这么说,主要也是因为他们之前的一些版本都过于小打小闹了,而这次他们几乎把能改的地方全改了。

另外,苹果也推出了“苹果智能”这个品牌,虽然中文听起来有点奇怪,但你只要看一眼英文单词就明白了“Apple Intelligence”,首字母缩写正好是AI。苹果这波真的是虽迟但到,重新定义了AI。

发布会持续了将近两个小时。前1个小时,苹果介绍了非常多边缘功能的迭代,例如变换壁纸颜色和改变锁屏手电筒图标这样的“美丽废物”功能,丝毫没有提及 AI。

就在我万分懊恼不应该熬夜的时候,苹果的 CEO 蒂姆·库克漫步在苹果园区的小路上,对着苹果手机镜头说:“苹果 AI 来了。”原来这才是本场发布会的重头戏。

接下来从文本生成、图像生成到 Siri 的重生,发布会介绍了非常多的 AI 使用场景。作为咱AI学习圈同学的 AI 学习委员,我跟大家分享一下我记录的五条笔记。

第一条,苹果 AI 的五大优势关键词,“强大,直观,集成,个性化和隐私保护”。这是苹果软件工程高级副总裁克雷格·费德里吉在发布会中反复强调的,他也是整场发布会出镜率最高的人。

这五大关键词听起来很抽象,我来根据我的理解一个个词给你拆解一下。

  • Power:“强大”指的是苹果最近几年在软硬件上的飞速发展,特别是芯片上的进步确实非常明显,而好的 AI 应用场景对设备的配置要求很高。在这一点上,苹果对自己的设备能力非常自信。

  • Intuitive:“直观”是指苹果的 AI 场景设计追求易用,无论是照片里的人脸识别,还是智能推荐,都力求用户可以轻松上手。说到这里,我突然反应过来,这场发布会的上半场虽然没有提及AI,但苹果已经悄悄在很多场景里融入了人工智能。例如一个非常小的细节,是计算器的计算能力迭代。如果在备忘录里,竖着手写几个数字,然后只是在数字下划一条横线,系统会自动调用计算器做加法计算。这个镜头虽然只有短短三秒钟,但是非常符合“直观”这个词的定义。

  • Integrated:“集成”这个好理解,就是苹果自己的生态紧密链接,从 iPhone 到 iPad 到 Mac 到苹果手表,不同设备间的用户体验一致。

  • Personal:“个性化”是克雷格所说的,跟其他大模型相比,苹果能带来什么样的体验升级。因为苹果更了解用户的行为和偏好,所以可以为每个人提供个性化的建议和服务。

  • Private:“隐私保护”是苹果在发布所有 AI 功能时都会强调的重点,他们反复说,苹果 AI 处理任务会直接在设备上进行,而不是把数据上传云端。哪怕是要运行更复杂的任务,他们也会提供私有云计算,来保证隐私。这确实能命中很多用户或者企业的痛点。

讲完苹果 AI 五大优势关键词,我记下的第二条笔记,就是 Siri 的重生了。

从这次发布会展示出来的 Siri 功能来说,称其为“重生”毫不夸张。Siri 虽然之前号称是人工智能助手,但是直到 2023 年,它能做的事情其实跟 2013 年也差不多。所以在很多地方,Siri 前面经常会被羞辱性地加上一个形容词,叫“智障的 Siri”,但是今天发布会所展示的 Siri 使用场景,还是让人非常动心的。

例如苹果用1分钟演示了一个完整使用 Siri 的场景。演示者先按右边的实体键,唤起了 Siri,这次新增了一个动画效果,整个屏幕边框开始闪烁,非常有赛博朋克风。然后她问 Siri 她妈妈的航班信息。Siri 就先从短信应用里找到妈妈发来的具体航班号,然后读取降落时间,紧接着从日程应用中查找她的行程安排,发现她有空闲时间,最后在地图应用中推送,从当前位置到机场接机的最佳行程路线,需要21分钟。整个过程非常丝滑。

这个场景简直就是我们所能想象的 AI 落地的最佳场景了。如果我上面这段场景描述,你还没太理解的话,咱们再举个例子。例如现在深夜了,你还在公司加班,这时你唤起 Siri,跟它说:“我饿了。”然后它可能先查查你的健身应用,发现你已经半年没健身了,所以对吃不吃碳水已经没有限制了。然后它就打开你的美团外卖,自动帮你点一个过去两个月你在公司加班最喜欢吃的黄焖鸡米饭,还帮你自动加上备注“店家快点儿,饿死了,不要放香菜”。等你吃到一半的时候,Siri 还会提醒你:“现在还不下班吗?末班地铁还有15分钟到站,你现在走到地铁站正好能赶上。”

当然这次公布的 Siri 的一些功能,主要还是调用苹果的一些原生应用的能力。不过他们也说了,接下来会逐步进行 API 的迭代,方便其他应用调取 Siri。我会关注这个的进展,期待可以在我们的应用里早日加入相关功能。比如直接唤起 Siri,问它:“我之前看过的一本书,里面写了乔布斯是怎么骂微软的,你帮我找出来。”然后 Siri 就可以从我在电子书的阅读记录或者过往的笔记里找到这个内容。再比如直接唤起 Siri,说:“帮我找找得到里关于人工智能与中小学教育相结合的书里,评分最高的那本,开始读。”

所以这次 Siri 的功能发布,会给一大批应用更多的尝试可能性。

第三条笔记是关于 AI 生成图像的功能。整场发布会涉及到 AI 和图像结合的功能点比较多,让我印象比较深的有两个。第一个是Genmoji,这个怎么理解呢?其实就是让 AI 帮你快速生成聊天表情包。并且因为苹果手机里有你和你朋友的太多照片,所以你可以用指令让 AI 直接帮你生成一张表情包。当然美中不足的是,这个功能目前只能在苹果手机的“消息”中使用。对大部分国内同学来说,“消息”这个应用主要是用来收验证码和广告信息的,所以不够刚需。

另一个功能是图片游乐场,其实就是你可以用你的手机直接输入 AI 指令,然后能生成三张图片。它的优势在于你可以直接导入手机的图片,使用流程比较顺滑。不过不得不吐槽的是,目前 AI 生成的图片质量看起来塑料感十足,拿着随便玩玩还可以,不堪大用。

第四条笔记是关于 AI 图像搜索功能的,这个功能在发布会上被 Siri 抢去了风头,时间非常短,但相信对很多苹果手机用户来说是刚需。因为每天拍了很多照片,找的时候却只能凭借模糊的记忆去寻找,效率非常低。而新的苹果 AI 会推出照片搜索,可以输入一些关键词进行精准搜索。例如在演示环节,输入一个和孩子钓鱼的关键词,系统马上就挑出了几十张爸爸和孩子在不同时期一起钓鱼的照片,并自动组了一个短视频。这对很多父母来说,简直是晒娃的绝佳工具,例如可以找出孩子每年的生日照片,生成一个祝福视频。

另外,还可以直接描述场景,搜索视频里的场景并进行精准的时间点定位,这个使用场景也比较有想象力,只不过不知道真实用起来的效果怎么样。

第五条笔记是关于 ChatGPT 的。在本次大会前,很多现场参加会议的人,都纷纷秀出他们拍到的 OpenAI CEO 奥尔特曼的照片,大家都预测苹果和 OpenAI 会有重磅合作。果然在发布会最后,苹果直接放出了大招,就是当本地模型解决不了问题的情况下,Siri 会询问用户,要不要去问问 ChatGPT。这个调用不需要用户注册 OpenAI,而且完全免费。当然,如果你之前已经是 ChatGPT 的用户,可以绑定自己的账户,方便保存一些个性化设置。

这个功能,如果我们用简单粗暴一点儿的方式理解,那就是苹果用 Siri 给 ChatGPT 套了一个壳,可以以非常方便顺滑的方式开启和 ChatGPT 的对话。对于用户来说,这当然是好消息,因为可以使用现阶段最强大的 AI 模型。

对 OpenAI 来说,跟苹果绑定在一起,这让他们在大模型的竞争中又多了一个重磅盟友。毕竟苹果设备的很多信息,是 ChatGPT 仅靠文字无法获得的。并且这也相当于苹果在用自己多年的品牌信用,对市场说:“OpenAI 这兄弟的 AI 能力比我强多了,所以用它没错的。” 通过这个合作,OpenAI 从用户到品牌到训练数据,包括从苹果那儿收取的费用都有了,简直赚翻了。

不过,留给国内苹果用户的一个悬念就是,下一代苹果手机进入国内,绑定的 AI 模型会是哪家。

这次苹果发布会的 AI 亮点内容我就介绍到这里。其实就发布会本身而言,也能学到很多。例如整个发布会的场景非常干净,特别是苹果 CEO 库克的两次出场,一次是自己站在办公楼顶楼,旁边是一片一片的太阳能板;一次是自己走在园区的小路上,并且都是用 iPhone 手机拍摄,用 Mac 剪辑。整个发布会的科技感远不如我参加的任何一场线下大会,但却能让人更加聚焦内容本身。我特意截了两张图放在文稿里,你看一下,是不是我们很多短视频的拍摄背景都比这个要复杂很多?

好,这就是我熬夜看完苹果发布会写下的五条笔记,希望对你有帮助。如果里面有某个场景触动你了,你也可以留言跟我聊聊,你最希望苹果 AI 帮你解决什么问题?

这篇关于熬夜看完苹果发布会记下五条笔记:Siri的涅槃重生,OpenAI成最大赢家的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1053312

相关文章

Tolua使用笔记(上)

目录   1.准备工作 2.运行例子 01.HelloWorld:在C#中,创建和销毁Lua虚拟机 和 简单调用。 02.ScriptsFromFile:在C#中,对一个lua文件的执行调用 03.CallLuaFunction:在C#中,对lua函数的操作 04.AccessingLuaVariables:在C#中,对lua变量的操作 05.LuaCoroutine:在Lua中,

AssetBundle学习笔记

AssetBundle是unity自定义的资源格式,通过调用引擎的资源打包接口对资源进行打包成.assetbundle格式的资源包。本文介绍了AssetBundle的生成,使用,加载,卸载以及Unity资源更新的一个基本步骤。 目录 1.定义: 2.AssetBundle的生成: 1)设置AssetBundle包的属性——通过编辑器界面 补充:分组策略 2)调用引擎接口API

《offer来了》第二章学习笔记

1.集合 Java四种集合:List、Queue、Set和Map 1.1.List:可重复 有序的Collection ArrayList: 基于数组实现,增删慢,查询快,线程不安全 Vector: 基于数组实现,增删慢,查询快,线程安全 LinkedList: 基于双向链实现,增删快,查询慢,线程不安全 1.2.Queue:队列 ArrayBlockingQueue:

操作系统实训复习笔记(1)

目录 Linux vi/vim编辑器(简单) (1)vi/vim基本用法。 (2)vi/vim基础操作。 进程基础操作(简单) (1)fork()函数。 写文件系统函数(中等) ​编辑 (1)C语言读取文件。 (2)C语言写入文件。 1、write()函数。  读文件系统函数(简单) (1)read()函数。 作者本人的操作系统实训复习笔记 Linux

LVGL快速入门笔记

目录 一、基础知识 1. 基础对象(lv_obj) 2. 基础对象的大小(size) 3. 基础对象的位置(position) 3.1 直接设置方式 3.2 参照父对象对齐 3.3 获取位置 4. 基础对象的盒子模型(border-box) 5. 基础对象的样式(styles) 5.1 样式的状态和部分 5.1.1 对象可以处于以下状态States的组合: 5.1.2 对象

DDS信号的发生器(验证篇)——FPGA学习笔记8

前言:第一部分详细讲解DDS核心框图,还请读者深入阅读第一部分,以便理解DDS核心思想 三刷小梅哥视频总结! 小梅哥https://www.corecourse.com/lander 一、DDS简介         DDS(Direct Digital Synthesizer)即数字合成器,是一种新型的频率合成技术,具有低成本、低功耗、高分辨率、频率转换时间短、相位连续性好等优点,对数字信

数据库原理与安全复习笔记(未完待续)

1 概念 产生与发展:人工管理阶段 → \to → 文件系统阶段 → \to → 数据库系统阶段。 数据库系统特点:数据的管理者(DBMS);数据结构化;数据共享性高,冗余度低,易于扩充;数据独立性高。DBMS 对数据的控制功能:数据的安全性保护;数据的完整性检查;并发控制;数据库恢复。 数据库技术研究领域:数据库管理系统软件的研发;数据库设计;数据库理论。数据模型要素 数据结构:描述数据库

【软考】信息系统项目管理师(高项)备考笔记——信息系统项目管理基础

信息系统项目管理基础 日常笔记 项目的特点:临时性(一次性)、独特的产品、服务或成果、逐步完善、资源约束、目的性。 临时性是指每一个项目都有确定的开始和结束日期独特性,创造独特的可交付成果,如产品、服务或成果逐步完善意味着分步、连续的积累。例如,在项目早期,项目范围的说明是粗略的,随着项目团队对目标和可交付成果的理解更完整和深入时,项目的范围也就更具体和详细。 战略管理包括以下三个过程

【软考】信息系统项目管理师(高项)备考笔记——信息化与信息系统

信息化与信息系统 最近在备考信息系统项目管理师软考证书,特记录笔记留念,也希望可以帮到有需求的人。 因为这是从notion里导出来的,格式上可能有点问题,懒的逐条修改了,还望见谅! 日常笔记 核心知识 信息的质量属性:1.精确性 2.完整性 3.可靠性 4.及时性 5.经济性 6.可验证下 7.安全性 信息的传输技术(通常指通信、网络)是信息技术的核心。另外,噪声影响的是信道

flex布局学习笔记(flex布局教程)

前端笔试⾯试经常会问到:不定宽⾼如何⽔平垂直居中。最简单的实现⽅法就是flex布局,⽗元素加上如下代码即 可: display: flex; justify-content: center; align-items :center; 。下⾯详细介绍下flex布局吧。   2009年,W3C提出了 Flex布局,可以简便⼂完整⼂响应式地实现各种页⾯布局。⽬前已得到了所有浏览器的⽀持,这意味着,现