WWDC 苹果发布 AI 全家桶;三星宣布「实时翻译」将兼容第三方 App丨 RTE 开发者日报 Vol.222

本文主要是介绍WWDC 苹果发布 AI 全家桶;三星宣布「实时翻译」将兼容第三方 App丨 RTE 开发者日报 Vol.222,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

在这里插入图片描述

开发者朋友们大家好:

这里是 「RTE 开发者日报」 ,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的新闻」、「有态度的观点」、「有意思的数据」、「有思考的文章」、「有看点的会议」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。

本期编辑:@CY,@JLT,@鲍勃

01有话题的新闻

1、苹果 Apple Intelligence 登场:提智 Siri,帮你管理通知等

6 月 11 日消息,苹果公司在今天召开的 2024 年度 WWDC 全球开发者大会上,正式宣布「苹果智能」(Apple Intelligence),将会为 iPhone、Mac 等设备提供一系列 AI 功能。

  • 帮你操作应用

苹果公司表示,其人工智能功能将能在应用程序中为你做一些事情。它将能够管理你的通知,自动为你写东西,或总结邮件和其他应用程序中的文本。

苹果还表示,它还能做一些事情,比如引用一个应用程序来执行另一个应用程序中的操作,比如让 Apple Intelligence 播放你女友发给你的播客。

  • Siri 变得更加智能

苹果公司表示,在 iOS 18 中,用户将能更自然地与 Siri 对话。新 Siri 可以理解上下文,因此你在随后的请求中不必重复信息。

App Intents 可以让 Siri 与第一方、第三方应用程序深度合作,在屏幕上感知你当前正在查看的内容,并能采取应用内操作。苹果演示了让照片应用编辑你正在查看的图片,Siri 会代表你执行调整。

  • 隐私

该公司表示,其人工智能功能将在设备上处理,以保证信息的私密性。不过,你需要 A17 Pro 或 M 系列芯片才能利用这些功能。此外,「语义索引」(semantic index)也是其中的一部分,它会在需要时获取个人信息,并在各个应用程序中显示出来。

对于需要调用云端的 AI 功能,苹果公司表示会使用「私有云」的,数据永远不会存储在服务器上,苹果公司也表示永远无法访问这些数据。该公司表示,将邀请独立专家来验证苹果的说法是否属实。(@IT 之家)

2、OpenAI 对 AI 语音引擎非常谨慎:可能永远不会被广泛使用

6 月 10 日消息,据外媒报道,几个月内,OpenAI 第二次解释其文本转音频工具,提醒大家该工具尚未广泛使用,也可能永远不会被广泛使用。该公司周五在其网站上发表的声明中表示:无论我们最终是否会广泛部署这项技术,让世界各地的人们了解其发展方向都很重要。这就是为什么我们要解释该模型的工作原理、我们如何将其用于研究和教育,以及我们如何围绕它实施安全措施。

去年年底,OpenAI 与公司外部的一小群用户分享了其语音引擎,该引擎依靠文本输入和 15 秒的人类声音片段来生成听起来与原始说话者非常相似的自然语音。该工具可以用多种语言创建听起来令人信服的人类声音。当时,该公司表示,它选择预览该技术但不会广泛发布,以增强社会韧性,以抵御越来越令人信服的生成模型的威胁。(@鞭牛士)

3、本地 AI 运行、支持简中,三星宣布「实时翻译」将兼容第三方 App

三星公司近日发布新闻稿,最新 Galaxy AI 套件中实时翻译(Live Translate)功能将兼容第三方应用程序,意味着用户可以在喜欢的应用中使用基于 AI 的翻译功能了。

实时翻译功能向第三方应用开放,无论是对于普通用户,还是专业用户来说都是好事,可以让用户更好地和外国朋友或商业伙伴保持联系,消除语言障碍。

三星尚未透露有关支持应用程序的更多具体细节。实时翻译功能不需要借助云服务,完全在本地设备上运行,因此用户始终掌控自己共享的数据。(@IT 之家)

4、EOS R7 + 双摄相机镜头可拍 3D 视频,苹果佳能合作共建「空间视频」生态

IT 之家 6 月 11 日消息,在目前正在进行的苹果 WWDC 2024 中,苹果公司宣布与佳能合作,将推出能拍摄 Apple 空间视频格式的「全新空间镜头」,该镜头为「RF-S 7.8mm F4 STM」,号称搭配佳能 EOS R7 相机效果更佳。

IT 之家获悉,佳能此前已经推出 RF5.2mm F2.8 L DUAL FISHEYE 鱼眼镜头,这款镜头国行售价 14399 元,主要用于拍摄 VR 视频,不过目前不得而知该镜头是否兼容相关空间视频模式。(@IT 之家)

02有态度的观点

1、傅盛评阿里云「最强开源模型」:长远看来,开源大模型能力会超越闭源

近日,阿里云发布开源模型 Qwen2-72B。据介绍,该模型性能超过美国最强的开源模型 Llama3-70B,也超过众多国内闭源大模型。对此,猎豹移动董事长兼 CEO、猎户星空董事长傅盛发视频表示,正当国内某大厂 CEO 说闭源模型的能力将持续超越开源模型时,阿里巴巴刚发布的 Qwen2-72B 开源模型能力已经超越了国内绝大多数闭源模型。

「我们之前一直认为开源大模型和闭源大模型会并驾齐驱,而且长远看来,我认为开源社区的大模型能力会超越闭源,这背后的原因就是开源并不是简单的做雷锋,而是结合自己的商业模式,结合能够形成社区的反馈能力的一套战略部署。」(@新浪科技)

2、Pika 团队:打败 Sora 不难,我们的算法能够以小胜大

即使 Sora 已经强势「炸」过场,Pika 还是再次带着硅谷一众明星资方的投票回到了舆论中心。6 月 5 日,Pika 宣布已完成 8000 万美元(约合人民币 5.8 亿元)的 B 轮融资,总融资额达到 1.35 亿美元,较 2023 年末,公司投后估值实现翻倍至 4.7 亿美元。

「我们会更 aggressive 地做视频大模型」,这家刚刚度过一周年生日的视频生成创业公司,计划在这轮融资之后快速扩张研究和工程师团队。(@机器之心)

3、马斯克怒喷苹果与 OpenAI 的合作:考虑禁止苹果设备进入我的公司

苹果宣布与 OpenAI 合作,将 GPT-4o 功能集成到苹果设备中。对此,马斯克表示强烈不满,认为这将构成安全风险,考虑禁止苹果设备进入他的公司,并要求使用苹果设备的人员在入口处接受检查,存放设备于法拉第笼中。

他还批评苹果无法自主开发 AI,却声称能确保 OpenAI 保护用户安全和隐私,认为这是出卖用户的行为。(@腾讯科技)

写在最后:

我们欢迎更多的小伙伴参与「RTE 开发者日报」内容的共创,感兴趣的朋友请通过开发者社区或公众号留言联系,记得报暗号「共创」。

对于任何反馈(包括但不限于内容上、形式上)我们不胜感激、并有小惊喜回馈,例如你希望从日报中看到哪些内容;自己推荐的信源、项目、话题、活动等;或者列举几个你喜欢看、平时常看的内容渠道;内容排版或呈现形式上有哪些可以改进的地方等。
在这里插入图片描述

素材来源官方媒体/网络新闻

这篇关于WWDC 苹果发布 AI 全家桶;三星宣布「实时翻译」将兼容第三方 App丨 RTE 开发者日报 Vol.222的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1051701

相关文章

Ilya-AI分享的他在OpenAI学习到的15个提示工程技巧

Ilya(不是本人,claude AI)在社交媒体上分享了他在OpenAI学习到的15个Prompt撰写技巧。 以下是详细的内容: 提示精确化:在编写提示时,力求表达清晰准确。清楚地阐述任务需求和概念定义至关重要。例:不用"分析文本",而用"判断这段话的情感倾向:积极、消极还是中性"。 快速迭代:善于快速连续调整提示。熟练的提示工程师能够灵活地进行多轮优化。例:从"总结文章"到"用

AI绘图怎么变现?想做点副业的小白必看!

在科技飞速发展的今天,AI绘图作为一种新兴技术,不仅改变了艺术创作的方式,也为创作者提供了多种变现途径。本文将详细探讨几种常见的AI绘图变现方式,帮助创作者更好地利用这一技术实现经济收益。 更多实操教程和AI绘画工具,可以扫描下方,免费获取 定制服务:个性化的创意商机 个性化定制 AI绘图技术能够根据用户需求生成个性化的头像、壁纸、插画等作品。例如,姓氏头像在电商平台上非常受欢迎,

从去中心化到智能化:Web3如何与AI共同塑造数字生态

在数字时代的演进中,Web3和人工智能(AI)正成为塑造未来互联网的两大核心力量。Web3的去中心化理念与AI的智能化技术,正相互交织,共同推动数字生态的变革。本文将探讨Web3与AI的融合如何改变数字世界,并展望这一新兴组合如何重塑我们的在线体验。 Web3的去中心化愿景 Web3代表了互联网的第三代发展,它基于去中心化的区块链技术,旨在创建一个开放、透明且用户主导的数字生态。不同于传统

AI一键生成 PPT

AI一键生成 PPT 操作步骤 作为一名打工人,是不是经常需要制作各种PPT来分享我的生活和想法。但是,你们知道,有时候灵感来了,时间却不够用了!😩直到我发现了Kimi AI——一个能够自动生成PPT的神奇助手!🌟 什么是Kimi? 一款月之暗面科技有限公司开发的AI办公工具,帮助用户快速生成高质量的演示文稿。 无论你是职场人士、学生还是教师,Kimi都能够为你的办公文

高效+灵活,万博智云全球发布AWS无代理跨云容灾方案!

摘要 近日,万博智云推出了基于AWS的无代理跨云容灾解决方案,并与拉丁美洲,中东,亚洲的合作伙伴面向全球开展了联合发布。这一方案以AWS应用环境为基础,将HyperBDR平台的高效、灵活和成本效益优势与无代理功能相结合,为全球企业带来实现了更便捷、经济的数据保护。 一、全球联合发布 9月2日,万博智云CEO Michael Wong在线上平台发布AWS无代理跨云容灾解决方案的阐述视频,介绍了

Andrej Karpathy最新采访:认知核心模型10亿参数就够了,AI会打破教育不公的僵局

夕小瑶科技说 原创  作者 | 海野 AI圈子的红人,AI大神Andrej Karpathy,曾是OpenAI联合创始人之一,特斯拉AI总监。上一次的动态是官宣创办一家名为 Eureka Labs 的人工智能+教育公司 ,宣布将长期致力于AI原生教育。 近日,Andrej Karpathy接受了No Priors(投资博客)的采访,与硅谷知名投资人 Sara Guo 和 Elad G

C#实战|大乐透选号器[6]:实现实时显示已选择的红蓝球数量

哈喽,你好啊,我是雷工。 关于大乐透选号器在前面已经记录了5篇笔记,这是第6篇; 接下来实现实时显示当前选中红球数量,蓝球数量; 以下为练习笔记。 01 效果演示 当选择和取消选择红球或蓝球时,在对应的位置显示实时已选择的红球、蓝球的数量; 02 标签名称 分别设置Label标签名称为:lblRedCount、lblBlueCount

AI hospital 论文Idea

一、Benchmarking Large Language Models on Communicative Medical Coaching: A Dataset and a Novel System论文地址含代码 大多数现有模型和工具主要迎合以患者为中心的服务。这项工作深入探讨了LLMs在提高医疗专业人员的沟通能力。目标是构建一个模拟实践环境,人类医生(即医学学习者)可以在其中与患者代理进行医学

AI行业应用(不定期更新)

ChatPDF 可以让你上传一个 PDF 文件,然后针对这个 PDF 进行小结和提问。你可以把各种各样你要研究的分析报告交给它,快速获取到想要知道的信息。https://www.chatpdf.com/

【北交大信息所AI-Max2】使用方法

BJTU信息所集群AI_MAX2使用方法 使用的前提是预约到相应的算力卡,拥有登录权限的账号密码,一般为导师组共用一个。 有浏览器、ssh工具就可以。 1.新建集群Terminal 浏览器登陆10.126.62.75 (如果是1集群把75改成66) 交互式开发 执行器选Terminal 密码随便设一个(需记住) 工作空间:私有数据、全部文件 加速器选GeForce_RTX_2080_Ti