熬夜看完苹果发布会记下五条笔记:Siri的涅槃重生,OpenAI成最大赢家

本文主要是介绍熬夜看完苹果发布会记下五条笔记:Siri的涅槃重生,OpenAI成最大赢家,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

你好,我是悦创。

北京时间6月11日凌晨1点,也就是几个小时之前,苹果公司召开了自己今年的开发者大会 WWDC,其中推出了堪称苹果十年来最大的一次版本更新——iOS18。当然,我敢这么说,主要也是因为他们之前的一些版本都过于小打小闹了,而这次他们几乎把能改的地方全改了。

另外,苹果也推出了“苹果智能”这个品牌,虽然中文听起来有点奇怪,但你只要看一眼英文单词就明白了“Apple Intelligence”,首字母缩写正好是AI。苹果这波真的是虽迟但到,重新定义了AI。

发布会持续了将近两个小时。前1个小时,苹果介绍了非常多边缘功能的迭代,例如变换壁纸颜色和改变锁屏手电筒图标这样的“美丽废物”功能,丝毫没有提及 AI。

就在我万分懊恼不应该熬夜的时候,苹果的 CEO 蒂姆·库克漫步在苹果园区的小路上,对着苹果手机镜头说:“苹果 AI 来了。”原来这才是本场发布会的重头戏。

接下来从文本生成、图像生成到 Siri 的重生,发布会介绍了非常多的 AI 使用场景。作为咱AI学习圈同学的 AI 学习委员,我跟大家分享一下我记录的五条笔记。

第一条,苹果 AI 的五大优势关键词,“强大,直观,集成,个性化和隐私保护”。这是苹果软件工程高级副总裁克雷格·费德里吉在发布会中反复强调的,他也是整场发布会出镜率最高的人。

这五大关键词听起来很抽象,我来根据我的理解一个个词给你拆解一下。

  • Power:“强大”指的是苹果最近几年在软硬件上的飞速发展,特别是芯片上的进步确实非常明显,而好的 AI 应用场景对设备的配置要求很高。在这一点上,苹果对自己的设备能力非常自信。

  • Intuitive:“直观”是指苹果的 AI 场景设计追求易用,无论是照片里的人脸识别,还是智能推荐,都力求用户可以轻松上手。说到这里,我突然反应过来,这场发布会的上半场虽然没有提及AI,但苹果已经悄悄在很多场景里融入了人工智能。例如一个非常小的细节,是计算器的计算能力迭代。如果在备忘录里,竖着手写几个数字,然后只是在数字下划一条横线,系统会自动调用计算器做加法计算。这个镜头虽然只有短短三秒钟,但是非常符合“直观”这个词的定义。

  • Integrated:“集成”这个好理解,就是苹果自己的生态紧密链接,从 iPhone 到 iPad 到 Mac 到苹果手表,不同设备间的用户体验一致。

  • Personal:“个性化”是克雷格所说的,跟其他大模型相比,苹果能带来什么样的体验升级。因为苹果更了解用户的行为和偏好,所以可以为每个人提供个性化的建议和服务。

  • Private:“隐私保护”是苹果在发布所有 AI 功能时都会强调的重点,他们反复说,苹果 AI 处理任务会直接在设备上进行,而不是把数据上传云端。哪怕是要运行更复杂的任务,他们也会提供私有云计算,来保证隐私。这确实能命中很多用户或者企业的痛点。

讲完苹果 AI 五大优势关键词,我记下的第二条笔记,就是 Siri 的重生了。

从这次发布会展示出来的 Siri 功能来说,称其为“重生”毫不夸张。Siri 虽然之前号称是人工智能助手,但是直到 2023 年,它能做的事情其实跟 2013 年也差不多。所以在很多地方,Siri 前面经常会被羞辱性地加上一个形容词,叫“智障的 Siri”,但是今天发布会所展示的 Siri 使用场景,还是让人非常动心的。

例如苹果用1分钟演示了一个完整使用 Siri 的场景。演示者先按右边的实体键,唤起了 Siri,这次新增了一个动画效果,整个屏幕边框开始闪烁,非常有赛博朋克风。然后她问 Siri 她妈妈的航班信息。Siri 就先从短信应用里找到妈妈发来的具体航班号,然后读取降落时间,紧接着从日程应用中查找她的行程安排,发现她有空闲时间,最后在地图应用中推送,从当前位置到机场接机的最佳行程路线,需要21分钟。整个过程非常丝滑。

这个场景简直就是我们所能想象的 AI 落地的最佳场景了。如果我上面这段场景描述,你还没太理解的话,咱们再举个例子。例如现在深夜了,你还在公司加班,这时你唤起 Siri,跟它说:“我饿了。”然后它可能先查查你的健身应用,发现你已经半年没健身了,所以对吃不吃碳水已经没有限制了。然后它就打开你的美团外卖,自动帮你点一个过去两个月你在公司加班最喜欢吃的黄焖鸡米饭,还帮你自动加上备注“店家快点儿,饿死了,不要放香菜”。等你吃到一半的时候,Siri 还会提醒你:“现在还不下班吗?末班地铁还有15分钟到站,你现在走到地铁站正好能赶上。”

当然这次公布的 Siri 的一些功能,主要还是调用苹果的一些原生应用的能力。不过他们也说了,接下来会逐步进行 API 的迭代,方便其他应用调取 Siri。我会关注这个的进展,期待可以在我们的应用里早日加入相关功能。比如直接唤起 Siri,问它:“我之前看过的一本书,里面写了乔布斯是怎么骂微软的,你帮我找出来。”然后 Siri 就可以从我在电子书的阅读记录或者过往的笔记里找到这个内容。再比如直接唤起 Siri,说:“帮我找找得到里关于人工智能与中小学教育相结合的书里,评分最高的那本,开始读。”

所以这次 Siri 的功能发布,会给一大批应用更多的尝试可能性。

第三条笔记是关于 AI 生成图像的功能。整场发布会涉及到 AI 和图像结合的功能点比较多,让我印象比较深的有两个。第一个是Genmoji,这个怎么理解呢?其实就是让 AI 帮你快速生成聊天表情包。并且因为苹果手机里有你和你朋友的太多照片,所以你可以用指令让 AI 直接帮你生成一张表情包。当然美中不足的是,这个功能目前只能在苹果手机的“消息”中使用。对大部分国内同学来说,“消息”这个应用主要是用来收验证码和广告信息的,所以不够刚需。

另一个功能是图片游乐场,其实就是你可以用你的手机直接输入 AI 指令,然后能生成三张图片。它的优势在于你可以直接导入手机的图片,使用流程比较顺滑。不过不得不吐槽的是,目前 AI 生成的图片质量看起来塑料感十足,拿着随便玩玩还可以,不堪大用。

第四条笔记是关于 AI 图像搜索功能的,这个功能在发布会上被 Siri 抢去了风头,时间非常短,但相信对很多苹果手机用户来说是刚需。因为每天拍了很多照片,找的时候却只能凭借模糊的记忆去寻找,效率非常低。而新的苹果 AI 会推出照片搜索,可以输入一些关键词进行精准搜索。例如在演示环节,输入一个和孩子钓鱼的关键词,系统马上就挑出了几十张爸爸和孩子在不同时期一起钓鱼的照片,并自动组了一个短视频。这对很多父母来说,简直是晒娃的绝佳工具,例如可以找出孩子每年的生日照片,生成一个祝福视频。

另外,还可以直接描述场景,搜索视频里的场景并进行精准的时间点定位,这个使用场景也比较有想象力,只不过不知道真实用起来的效果怎么样。

第五条笔记是关于 ChatGPT 的。在本次大会前,很多现场参加会议的人,都纷纷秀出他们拍到的 OpenAI CEO 奥尔特曼的照片,大家都预测苹果和 OpenAI 会有重磅合作。果然在发布会最后,苹果直接放出了大招,就是当本地模型解决不了问题的情况下,Siri 会询问用户,要不要去问问 ChatGPT。这个调用不需要用户注册 OpenAI,而且完全免费。当然,如果你之前已经是 ChatGPT 的用户,可以绑定自己的账户,方便保存一些个性化设置。

这个功能,如果我们用简单粗暴一点儿的方式理解,那就是苹果用 Siri 给 ChatGPT 套了一个壳,可以以非常方便顺滑的方式开启和 ChatGPT 的对话。对于用户来说,这当然是好消息,因为可以使用现阶段最强大的 AI 模型。

对 OpenAI 来说,跟苹果绑定在一起,这让他们在大模型的竞争中又多了一个重磅盟友。毕竟苹果设备的很多信息,是 ChatGPT 仅靠文字无法获得的。并且这也相当于苹果在用自己多年的品牌信用,对市场说:“OpenAI 这兄弟的 AI 能力比我强多了,所以用它没错的。” 通过这个合作,OpenAI 从用户到品牌到训练数据,包括从苹果那儿收取的费用都有了,简直赚翻了。

不过,留给国内苹果用户的一个悬念就是,下一代苹果手机进入国内,绑定的 AI 模型会是哪家。

这次苹果发布会的 AI 亮点内容我就介绍到这里。其实就发布会本身而言,也能学到很多。例如整个发布会的场景非常干净,特别是苹果 CEO 库克的两次出场,一次是自己站在办公楼顶楼,旁边是一片一片的太阳能板;一次是自己走在园区的小路上,并且都是用 iPhone 手机拍摄,用 Mac 剪辑。整个发布会的科技感远不如我参加的任何一场线下大会,但却能让人更加聚焦内容本身。我特意截了两张图放在文稿里,你看一下,是不是我们很多短视频的拍摄背景都比这个要复杂很多?

好,这就是我熬夜看完苹果发布会写下的五条笔记,希望对你有帮助。如果里面有某个场景触动你了,你也可以留言跟我聊聊,你最希望苹果 AI 帮你解决什么问题?

这篇关于熬夜看完苹果发布会记下五条笔记:Siri的涅槃重生,OpenAI成最大赢家的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1053312

相关文章

Ilya-AI分享的他在OpenAI学习到的15个提示工程技巧

Ilya(不是本人,claude AI)在社交媒体上分享了他在OpenAI学习到的15个Prompt撰写技巧。 以下是详细的内容: 提示精确化:在编写提示时,力求表达清晰准确。清楚地阐述任务需求和概念定义至关重要。例:不用"分析文本",而用"判断这段话的情感倾向:积极、消极还是中性"。 快速迭代:善于快速连续调整提示。熟练的提示工程师能够灵活地进行多轮优化。例:从"总结文章"到"用

秋招最新大模型算法面试,熬夜都要肝完它

💥大家在面试大模型LLM这个板块的时候,不知道面试完会不会复盘、总结,做笔记的习惯,这份大模型算法岗面试八股笔记也帮助不少人拿到过offer ✨对于面试大模型算法工程师会有一定的帮助,都附有完整答案,熬夜也要看完,祝大家一臂之力 这份《大模型算法工程师面试题》已经上传CSDN,还有完整版的大模型 AI 学习资料,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

【学习笔记】 陈强-机器学习-Python-Ch15 人工神经网络(1)sklearn

系列文章目录 监督学习:参数方法 【学习笔记】 陈强-机器学习-Python-Ch4 线性回归 【学习笔记】 陈强-机器学习-Python-Ch5 逻辑回归 【课后题练习】 陈强-机器学习-Python-Ch5 逻辑回归(SAheart.csv) 【学习笔记】 陈强-机器学习-Python-Ch6 多项逻辑回归 【学习笔记 及 课后题练习】 陈强-机器学习-Python-Ch7 判别分析 【学

系统架构师考试学习笔记第三篇——架构设计高级知识(20)通信系统架构设计理论与实践

本章知识考点:         第20课时主要学习通信系统架构设计的理论和工作中的实践。根据新版考试大纲,本课时知识点会涉及案例分析题(25分),而在历年考试中,案例题对该部分内容的考查并不多,虽在综合知识选择题目中经常考查,但分值也不高。本课时内容侧重于对知识点的记忆和理解,按照以往的出题规律,通信系统架构设计基础知识点多来源于教材内的基础网络设备、网络架构和教材外最新时事热点技术。本课时知识

poj 3723 kruscal,反边取最大生成树。

题意: 需要征募女兵N人,男兵M人。 每征募一个人需要花费10000美元,但是如果已经招募的人中有一些关系亲密的人,那么可以少花一些钱。 给出若干的男女之间的1~9999之间的亲密关系度,征募某个人的费用是10000 - (已经征募的人中和自己的亲密度的最大值)。 要求通过适当的招募顺序使得征募所有人的费用最小。 解析: 先设想无向图,在征募某个人a时,如果使用了a和b之间的关系

poj 3258 二分最小值最大

题意: 有一些石头排成一条线,第一个和最后一个不能去掉。 其余的共可以去掉m块,要使去掉后石头间距的最小值最大。 解析: 二分石头,最小值最大。 代码: #include <iostream>#include <cstdio>#include <cstdlib>#include <algorithm>#include <cstring>#include <c

poj 2175 最小费用最大流TLE

题意: 一条街上有n个大楼,坐标为xi,yi,bi个人在里面工作。 然后防空洞的坐标为pj,qj,可以容纳cj个人。 从大楼i中的人到防空洞j去避难所需的时间为 abs(xi - pi) + (yi - qi) + 1。 现在设计了一个避难计划,指定从大楼i到防空洞j避难的人数 eij。 判断如果按照原计划进行,所有人避难所用的时间总和是不是最小的。 若是,输出“OPETIMAL",若

poj 2135 有流量限制的最小费用最大流

题意: 农场里有n块地,其中约翰的家在1号地,二n号地有个很大的仓库。 农场有M条道路(双向),道路i连接着ai号地和bi号地,长度为ci。 约翰希望按照从家里出发,经过若干块地后到达仓库,然后再返回家中的顺序带朋友参观。 如果要求往返不能经过同一条路两次,求参观路线总长度的最小值。 解析: 如果只考虑去或者回的情况,问题只不过是无向图中两点之间的最短路问题。 但是现在要去要回

poj 2594 二分图最大独立集

题意: 求一张图的最大独立集,这题不同的地方在于,间接相邻的点也可以有一条边,所以用floyd来把间接相邻的边也连起来。 代码: #include <iostream>#include <cstdio>#include <cstdlib>#include <algorithm>#include <cstring>#include <cmath>#include <sta

poj 3422 有流量限制的最小费用流 反用求最大 + 拆点

题意: 给一个n*n(50 * 50) 的数字迷宫,从左上点开始走,走到右下点。 每次只能往右移一格,或者往下移一格。 每个格子,第一次到达时可以获得格子对应的数字作为奖励,再次到达则没有奖励。 问走k次这个迷宫,最大能获得多少奖励。 解析: 拆点,拿样例来说明: 3 2 1 2 3 0 2 1 1 4 2 3*3的数字迷宫,走两次最大能获得多少奖励。 将每个点拆成两个