[AI Google] 在 Android 上以更多方式体验 Google AI

2024-06-09 12:28

本文主要是介绍[AI Google] 在 Android 上以更多方式体验 Google AI,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

总结

通过将 AI 直接构建到 Android 操作系统中,Google 正在重新想象用户与手机的互动方式。最新的更新包括用于家庭作业帮助的 Circle to Search、增强的 Gemini 助手功能以及通话期间的实时诈骗检测。Circle to Search 现在通过逐步指导帮助学生解决数学和物理问题,并将很快处理更复杂的问题。Gemini 变得更擅长理解上下文以帮助用户完成各种任务,并将推向数亿台设备。此外,Gemini Nano 的多模态功能将为视障用户带来更清晰的 TalkBack 描述。新的诈骗检测功能使用 Gemini Nano 在通话期间检测到诈骗模式时提醒用户。Google 致力于将 AI 集成到智能手机体验的每个部分,并鼓励开发者使用他们最新的 AI 模型和工具进行构建。


通过将 AI 直接构建到 Android 操作系统中,我们正在重新想象您与手机的互动方式。

一个 Android 吉祥物站在显示屏幕前,屏幕上显示了用于家庭作业帮助的 Circle to Search、诈骗检测警报、TalkBack 和 Gemini 的覆盖层,上面有一个按钮写着“询问此 PDF”。

我们正处于一代人的关键时刻,最新的 AI 进步正在重新发明手机能做的事情。随着 Google AI 成为 Android 操作系统核心的,数十亿 Android 用户现在可以以全新的方式与他们的设备互动。

今天,我们正在分享更新,让您在 Android 上体验 Google AI。

Circle to Search 现在可以帮助学生完成家庭作业

将 Circle to Search 直接构建到用户体验中,您可以使用简单的 gesture 搜索您在手机上看到的任何内容——无需停止您正在做的事情或切换到不同的应用程序。自三星 Unpacked 发布以来,我们已经为 Circle to Search 添加了新功能,如全屏翻译,并将可用性扩展到更多的 Pixel 和三星设备。

从今天开始,Circle to Search 现在可以帮助学生完成家庭作业,为他们提供更深入的理解,而不仅仅是答案——直接从他们的手机和平板电脑上。当学生圈出一个他们卡住的提示时,他们将获得逐步指导来解决一系列物理和数学1单词问题,无需离开他们的数字信息表或教学大纲。今年晚些时候,Circle to Search 将能够帮助解决甚至更复杂的涉及符号公式、图表等问题。这一切都归功于我们 LearnLM 努力增强我们的模型和产品以供学习。

Circle to Search 今天已经在超过 1 亿台设备上可用。计划将体验带到更多设备上,我们有望在年底前将这一数字翻倍。

Gemini 将变得更擅长理解上下文以帮助您完成任务

Android 上的 Gemini 是一种新型的助手,它使用生成式 AI 帮助您更有创造力和生产力。这种集成到 Android 中的体验正在变得更擅长理解您屏幕上的上下文和您正在使用的应用程序。

很快,您将能够在您所在的应用程序上方调出 Gemini 的覆盖层,以便更容易地以更多方式使用 Gemini。例如,您可以将生成的图像拖放到 Gmail、Google Messages 和其他地方,或点击“询问此视频”在 YouTube 视频中找到特定信息。如果您有 Gemini Advanced,您还将有“询问此 PDF”的选项,以便快速获取答案,而无需滚动浏览多个页面。此更新将在接下来的几个月内推送到数亿台设备上。

我们将继续改进 Gemini,为您提供更多与屏幕上内容相关的动态建议。

手机框架显示一个覆盖层,上面有四个图像,显示网球拍击中切片的泡菜,一个图像被拖出覆盖层以附加到短信。
手机框架显示一个覆盖层,上面的文本回答了一个关于泡菜球视频的问题。覆盖层下面的文本显示视频的标题卡,上面写着“3 分钟学会泡菜球”。覆盖层下是 YouTube 上播放的视频的一部分,显示泡菜球场。
手机框架显示一个覆盖层,上面的文本回答了泡菜球中是否允许旋转发球。覆盖层下面显示的是一个人打泡菜球的剪影,作为 PDF 的封面。

Gemini Nano 将迎来全多模态功能

Android 是第一个包括内置、设备上基础模型的移动操作系统。借助 Gemini Nano,我们能够迅速为您带来体验并完全保护您的信息隐私。从今年晚些时候的 Pixel 开始,我们将推出我们最新的模型,Gemini Nano with Multimodality。这意味着您的手机将不仅能够处理文本输入,还能够理解更多上下文信息,如视觉、声音和口语。

使用 TalkBack 获得更清晰的描述

今年晚些时候,Gemini Nano 的多模态功能将来到 TalkBack,帮助视力障碍或低视力的人获得更丰富、更清晰的图像描述。平均而言,TalkBack 用户每天会遇到 90 张未标记的图像。此更新将帮助填补缺失的信息——无论是家人或朋友发送的照片中的更多细节,还是网上购物时衣服的风格和剪裁。由于 Gemini Nano 是在设备上的,这些描述发生得很快,甚至在没有网络连接时也能工作。

在电话通话期间接收疑似诈骗的警报

根据最近的一份报告,在 12 个月的时间里,人们因欺诈损失了超过 1 万亿美元。我们正在测试一种新功能,使用 Gemini Nano 在通话期间提供实时警报,如果它检测到通常与诈骗相关的会话模式。例如,如果“银行代表”要求您紧急转移资金、使用礼品卡支付或请求个人信息,如卡 PIN 或密码,这些是不常见的银行请求,您将收到警报。这种保护完全在设备上进行,因此您的对话对您来说是私密的。我们将在今年晚些时候分享更多关于这个可选功能的信息。

红色框显示诈骗检测警报,文本写着“可能是诈骗,银行永远不会要求您移动您的资金以保持安全。”下面是“忽略并继续”或“结束通话”的选项。

Android 上还有更多

我们才刚刚开始探索设备上 AI 如何改变您的手机能做的事情,我们将继续在 Pixel、三星等每部分智能手机体验中构建 Google AI。如果您是开发者,请查看 Android Developers 博客,了解如何使用我们最新的 AI 模型和工具,如 Gemini Nano 和 Android Studio 中的 Gemini 构建。


  • 原文
  • AI 博客 - 从零开始学AI
  • 公众号 - 从零开始学AI

这篇关于[AI Google] 在 Android 上以更多方式体验 Google AI的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1045178

相关文章

Ilya-AI分享的他在OpenAI学习到的15个提示工程技巧

Ilya(不是本人,claude AI)在社交媒体上分享了他在OpenAI学习到的15个Prompt撰写技巧。 以下是详细的内容: 提示精确化:在编写提示时,力求表达清晰准确。清楚地阐述任务需求和概念定义至关重要。例:不用"分析文本",而用"判断这段话的情感倾向:积极、消极还是中性"。 快速迭代:善于快速连续调整提示。熟练的提示工程师能够灵活地进行多轮优化。例:从"总结文章"到"用

AI绘图怎么变现?想做点副业的小白必看!

在科技飞速发展的今天,AI绘图作为一种新兴技术,不仅改变了艺术创作的方式,也为创作者提供了多种变现途径。本文将详细探讨几种常见的AI绘图变现方式,帮助创作者更好地利用这一技术实现经济收益。 更多实操教程和AI绘画工具,可以扫描下方,免费获取 定制服务:个性化的创意商机 个性化定制 AI绘图技术能够根据用户需求生成个性化的头像、壁纸、插画等作品。例如,姓氏头像在电商平台上非常受欢迎,

从去中心化到智能化:Web3如何与AI共同塑造数字生态

在数字时代的演进中,Web3和人工智能(AI)正成为塑造未来互联网的两大核心力量。Web3的去中心化理念与AI的智能化技术,正相互交织,共同推动数字生态的变革。本文将探讨Web3与AI的融合如何改变数字世界,并展望这一新兴组合如何重塑我们的在线体验。 Web3的去中心化愿景 Web3代表了互联网的第三代发展,它基于去中心化的区块链技术,旨在创建一个开放、透明且用户主导的数字生态。不同于传统

AI一键生成 PPT

AI一键生成 PPT 操作步骤 作为一名打工人,是不是经常需要制作各种PPT来分享我的生活和想法。但是,你们知道,有时候灵感来了,时间却不够用了!😩直到我发现了Kimi AI——一个能够自动生成PPT的神奇助手!🌟 什么是Kimi? 一款月之暗面科技有限公司开发的AI办公工具,帮助用户快速生成高质量的演示文稿。 无论你是职场人士、学生还是教师,Kimi都能够为你的办公文

Andrej Karpathy最新采访:认知核心模型10亿参数就够了,AI会打破教育不公的僵局

夕小瑶科技说 原创  作者 | 海野 AI圈子的红人,AI大神Andrej Karpathy,曾是OpenAI联合创始人之一,特斯拉AI总监。上一次的动态是官宣创办一家名为 Eureka Labs 的人工智能+教育公司 ,宣布将长期致力于AI原生教育。 近日,Andrej Karpathy接受了No Priors(投资博客)的采访,与硅谷知名投资人 Sara Guo 和 Elad G

Android实现任意版本设置默认的锁屏壁纸和桌面壁纸(两张壁纸可不一致)

客户有些需求需要设置默认壁纸和锁屏壁纸  在默认情况下 这两个壁纸是相同的  如果需要默认的锁屏壁纸和桌面壁纸不一样 需要额外修改 Android13实现 替换默认桌面壁纸: 将图片文件替换frameworks/base/core/res/res/drawable-nodpi/default_wallpaper.*  (注意不能是bmp格式) 替换默认锁屏壁纸: 将图片资源放入vendo

内核启动时减少log的方式

内核引导选项 内核引导选项大体上可以分为两类:一类与设备无关、另一类与设备有关。与设备有关的引导选项多如牛毛,需要你自己阅读内核中的相应驱动程序源码以获取其能够接受的引导选项。比如,如果你想知道可以向 AHA1542 SCSI 驱动程序传递哪些引导选项,那么就查看 drivers/scsi/aha1542.c 文件,一般在前面 100 行注释里就可以找到所接受的引导选项说明。大多数选项是通过"_

Android平台播放RTSP流的几种方案探究(VLC VS ExoPlayer VS SmartPlayer)

技术背景 好多开发者需要遴选Android平台RTSP直播播放器的时候,不知道如何选的好,本文针对常用的方案,做个大概的说明: 1. 使用VLC for Android VLC Media Player(VLC多媒体播放器),最初命名为VideoLAN客户端,是VideoLAN品牌产品,是VideoLAN计划的多媒体播放器。它支持众多音频与视频解码器及文件格式,并支持DVD影音光盘,VCD影

AI hospital 论文Idea

一、Benchmarking Large Language Models on Communicative Medical Coaching: A Dataset and a Novel System论文地址含代码 大多数现有模型和工具主要迎合以患者为中心的服务。这项工作深入探讨了LLMs在提高医疗专业人员的沟通能力。目标是构建一个模拟实践环境,人类医生(即医学学习者)可以在其中与患者代理进行医学

AI行业应用(不定期更新)

ChatPDF 可以让你上传一个 PDF 文件,然后针对这个 PDF 进行小结和提问。你可以把各种各样你要研究的分析报告交给它,快速获取到想要知道的信息。https://www.chatpdf.com/