Meta与Ray-Ban合作推出了一款全新智能眼镜外观时尚,而且搭载了能够“看到“你所看到的一切的人工智能技术

本文主要是介绍Meta与Ray-Ban合作推出了一款全新智能眼镜外观时尚,而且搭载了能够“看到“你所看到的一切的人工智能技术,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领域的领跑者。点击订阅,与未来同行! 订阅:https://rengongzhineng.io/

“嘿,Meta,看看这个,告诉我哪些茶是无咖啡因的。”

当在Meta位于纽约总部戴着一副Meta Ray-Ban智能眼镜说出这句话时,正盯着桌上用记号笔涂黑了咖啡因标签的四个茶包。耳边传来轻微的点击声,紧接着Meta的AI声音告诉我,洋甘菊茶可能是无咖啡因的。它正在阅读标签并使用生成式AI做出判断。

这是我正在测试的一个功能,从今天开始就会推出到Meta的第二代Ray-Ban眼镜上 —— 这个功能是Meta首席执行官马克·扎克伯格在去年九月新眼镜发布时已经承诺的。这些AI功能,可以通过Meta眼镜上的摄像头查看图像,并用生成式AI进行解读,原本计划于2024年推出。Meta比我预期的更早引入了这些功能,尽管早期访问模式仍然非常是测试版。除了将Bing支持的搜索添加到Ray-Ban的新更新中,这增强了眼镜已有的语音激活功能,Meta的眼镜正在迅速获得新能力。

这次演示让我惊叹,因为我从未见过类似的东西。我看过一部分:Google Lens和其他手机上的工具已经在使用相机和AI,而Google Glass —— 十年前 —— 有一些翻译工具。然而,Meta眼镜调用AI来识别我周围世界中的东西的方式简单直接,感觉相当先进。我很兴奋能够尝试更多。

这些眼镜没有显示屏,AI只回应声音。但Meta View手机应用程序会保存照片和AI的回应以供日后查看。 Meta 多模态AI:目前的工作方式 目前这项功能还有限制。它只能通过拍照来识别你所看到的东西,然后AI进行分析。在发出语音请求后,你会听到快门声,然后几秒钟后会有回应。语音提示也很长:Meta眼镜上的每一个语音请求都需要以“嘿,Meta”开始,然后你需要跟上“看看并”(我最初以为需要说的是“嘿,Meta,看看这个”)来触发拍照,紧接着是你想让AI做的事情。“嘿,Meta,看看并告诉我用这些食材有哪些食谱。” “嘿,Meta,看看并编一个有趣的标题。” “嘿,Meta,看看并告诉我这是什么植物。”

每个请求都会触发快门声,然后是AI阅读图像并解释它的几秒钟暂停。这与手机上的AI相机应用程序的工作方式类似,除了戴在你脸上并且通过声音控制。

每个AI的回应和它查看的照片都储存在与眼镜配对的Meta View手机应用程序中。我喜欢这一点,因为它是后来的视觉/书面记录,就像记忆提示的笔记。我可以想象在某处漫步并提出问题,将其用作我的眼睛的某种头戴式Google搜索,无论是购物还是其他。

Meta的这款智能眼镜,不仅仅是科技的尖端产物,它的辅助功能也非常值得关注。想象一下,当我戴着这副没有配我视力的试验款Meta眼镜,询问它我正在看什么时,尽管回答在细节和准确性上有所不同,但它确实能给出一个大概的指引。它甚至能识别出我手中的眼镜,注意到镜片带有蓝色调(蓝黑框架,相当接近实际情况)。

不过,这副眼镜有时也会“产生幻觉”。比如我问桌前碗中的水果,它正确地列出了橙子、香蕉、火龙果和苹果,但错误地认为还有石榴(其实并没有)。当我让它为窗前的一个大毛绒熊猫编写标题时,它创造了一些可爱的标题,但有一个与实际情况不符,描述了一个孤独地看手机的场景。

当我看着一份西班牙语菜单,询问眼镜显示辛辣菜肴时,它能读出一些菜名并为我翻译关键食材,但当我再次询问含肉的菜肴时,它又用西班牙语回答了。

这项技术的可能性令人兴奋,而且可能极其有用。Meta承认,这次早期推出旨在发现漏洞并帮助改进眼镜上的AI工作方式。我发现有些时候需要频繁说“嘿,Meta,看看”,但这个过程可能会随着时间改变。当进行即时图像分析时,提出直接的后续问题有时可以不用再说“看看”,但这种做法的成功率可能会有所不同。

这种AI被Meta称为“多模态AI”,因为它结合了相机和语音聊天的功能,是公司计划将来将多种形式的输入混合在一起的AI的先驱,包括更多的感官数据。Qualcomm专注于AI的芯片组在Meta的新款Ray-Ban上已经准备好承担更多任务。Meta还计划随着时间的推移使这一过程更加无缝。

Meta首席技术官Andrew Bosworth曾在去年九月说,尽管眼镜现在需要语音提示来激活和“看到”以节省电池寿命,但最终它们将“配备足够低功耗的传感器,能够检测到触发意识的事件,进而触发AI。这正是我们正在努力实现的梦想。” Meta还在研究将多种形式的感官数据融合在一起的AI工具,以备更先进的未来可穿戴设备。

现在,这还是一个早期访问的测试版。Meta在这一阶段使用匿名查询数据来帮助改进其AI服务,这可能会引起一些关注隐私的人的担忧。我还不清楚具体的选择加入细节,但一旦最终的AI功能推出,可能是明年,更多离散的数据共享控制似乎可能到位。

这篇关于Meta与Ray-Ban合作推出了一款全新智能眼镜外观时尚,而且搭载了能够“看到“你所看到的一切的人工智能技术的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/510679

相关文章

基于人工智能的图像分类系统

目录 引言项目背景环境准备 硬件要求软件安装与配置系统设计 系统架构关键技术代码示例 数据预处理模型训练模型预测应用场景结论 1. 引言 图像分类是计算机视觉中的一个重要任务,目标是自动识别图像中的对象类别。通过卷积神经网络(CNN)等深度学习技术,我们可以构建高效的图像分类系统,广泛应用于自动驾驶、医疗影像诊断、监控分析等领域。本文将介绍如何构建一个基于人工智能的图像分类系统,包括环境

嵌入式QT开发:构建高效智能的嵌入式系统

摘要: 本文深入探讨了嵌入式 QT 相关的各个方面。从 QT 框架的基础架构和核心概念出发,详细阐述了其在嵌入式环境中的优势与特点。文中分析了嵌入式 QT 的开发环境搭建过程,包括交叉编译工具链的配置等关键步骤。进一步探讨了嵌入式 QT 的界面设计与开发,涵盖了从基本控件的使用到复杂界面布局的构建。同时也深入研究了信号与槽机制在嵌入式系统中的应用,以及嵌入式 QT 与硬件设备的交互,包括输入输出设

【专题】2024飞行汽车技术全景报告合集PDF分享(附原数据表)

原文链接: https://tecdat.cn/?p=37628 6月16日,小鹏汇天旅航者X2在北京大兴国际机场临空经济区完成首飞,这也是小鹏汇天的产品在京津冀地区进行的首次飞行。小鹏汇天方面还表示,公司准备量产,并计划今年四季度开启预售小鹏汇天分体式飞行汽车,探索分体式飞行汽车城际通勤。阅读原文,获取专题报告合集全文,解锁文末271份飞行汽车相关行业研究报告。 据悉,业内人士对飞行汽车行业

让树莓派智能语音助手实现定时提醒功能

最初的时候是想直接在rasa 的chatbot上实现,因为rasa本身是带有remindschedule模块的。不过经过一番折腾后,忽然发现,chatbot上实现的定时,语音助手不一定会有响应。因为,我目前语音助手的代码设置了长时间无应答会结束对话,这样一来,chatbot定时提醒的触发就不会被语音助手获悉。那怎么让语音助手也具有定时提醒功能呢? 我最后选择的方法是用threading.Time

金融业开源技术 术语

金融业开源技术  术语 1  范围 本文件界定了金融业开源技术的常用术语。 本文件适用于金融业中涉及开源技术的相关标准及规范性文件制定和信息沟通等活动。

智能交通(二)——Spinger特刊推荐

特刊征稿 01  期刊名称: Autonomous Intelligent Systems  特刊名称: Understanding the Policy Shift  with the Digital Twins in Smart  Transportation and Mobility 截止时间: 开放提交:2024年1月20日 提交截止日

基于 YOLOv5 的积水检测系统:打造高效智能的智慧城市应用

在城市发展中,积水问题日益严重,特别是在大雨过后,积水往往会影响交通甚至威胁人们的安全。通过现代计算机视觉技术,我们能够智能化地检测和识别积水区域,减少潜在危险。本文将介绍如何使用 YOLOv5 和 PyQt5 搭建一个积水检测系统,结合深度学习和直观的图形界面,为用户提供高效的解决方案。 源码地址: PyQt5+YoloV5 实现积水检测系统 预览: 项目背景

AI(文生语音)-TTS 技术线路探索学习:从拼接式参数化方法到Tacotron端到端输出

AI(文生语音)-TTS 技术线路探索学习:从拼接式参数化方法到Tacotron端到端输出 在数字化时代,文本到语音(Text-to-Speech, TTS)技术已成为人机交互的关键桥梁,无论是为视障人士提供辅助阅读,还是为智能助手注入声音的灵魂,TTS 技术都扮演着至关重要的角色。从最初的拼接式方法到参数化技术,再到现今的深度学习解决方案,TTS 技术经历了一段长足的进步。这篇文章将带您穿越时

系统架构设计师: 信息安全技术

简简单单 Online zuozuo: 简简单单 Online zuozuo 简简单单 Online zuozuo 简简单单 Online zuozuo 简简单单 Online zuozuo :本心、输入输出、结果 简简单单 Online zuozuo : 文章目录 系统架构设计师: 信息安全技术前言信息安全的基本要素:信息安全的范围:安全措施的目标:访问控制技术要素:访问控制包括:等保

【C++学习笔记 20】C++中的智能指针

智能指针的功能 在上一篇笔记提到了在栈和堆上创建变量的区别,使用new关键字创建变量时,需要搭配delete关键字销毁变量。而智能指针的作用就是调用new分配内存时,不必自己去调用delete,甚至不用调用new。 智能指针实际上就是对原始指针的包装。 unique_ptr 最简单的智能指针,是一种作用域指针,意思是当指针超出该作用域时,会自动调用delete。它名为unique的原因是这个