AI耳机要想“复制”智能音箱的爆红,还要迈过哪些坎?

2023-12-24 09:38

本文主要是介绍AI耳机要想“复制”智能音箱的爆红,还要迈过哪些坎?,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

如果说智能音箱的爆红,是在情理之中,那最近大伙儿扎堆AI耳机是不是在意料之外呢?

先说海外的,2017年10月谷歌公布Pixel Buds耳机,被认为是业内首个真正意义上的“智能耳机”。其最大亮点是整合了谷歌语音助理,用户通过特定手势激活它后可获取线路,设定提醒或者控制音乐等,与Pixel配对后还能实时翻译。

随后的11月,Line也发布了一款AI耳机MARS,可即时翻译10种语言,不同语言两人一人戴上一只,就可自由交流。而澳大利亚初创公司Lingmo先于2017年6月发布了一款翻译耳机“Translate One2One”,支持8种语言,3~5秒钟即可完成翻译。

此外还有苹果的AirPods、三星推出的Gear Iconx( 2018 )无线耳机、索尼Xperia Ear智能耳机等,语音巨头亚马逊早在 2016 年 8 月也申请过一款降噪耳机的专利,据说目前也正在研发打磨一款智能语音耳机。

再说国内,先是汪峰主导的FIIL耳机牵手百度 DuerOS 推出了 FIIL 随身星,将耳机贴上了AI的标签;接着FIIL的“老对手”1MORE(万魔耳机)也推出了自家的 AI 耳机 iBFree 2。

于此同时,咪咕公司与科大讯飞联合推出了智能耳机莫比斯,其具备语音对话、运动监测、智能翻译、出行导航等四大功能,并在12月18号上线京东众筹。而在刚刚结束的中国创新创业大赛首届智慧家庭专业赛总决赛上,总冠军就是美国麻省理工学院两位校友David朱大卫和Max武巍创立的Vinci耳机项目。

AI耳机的想象空间在哪?真能和智能音箱一样爆红吗?

AI连上耳机后,AI耳机就是电子助理+私人FM?

我们先来回答第一个问题,尽管对于智能音箱和AI耳机,还没有明确的标准和定义。但是,通过对已经推出的相关产品进行分析后,我们可以看出人机交互以及算法推荐是AI耳机最基本和最突出的特点。

1.因为人机交互,耳机成了缩小版的“电子助理”

AI耳机无论是从手持,发展到头戴、耳塞和后挂,还是从动圈,发展到动铁、圈铁,其佩戴方式和扬声器的变化对于人们的生活来说其实并没有突破性的变革,因为它仍旧是一个音频传输器。而搭载人工智能之后,它变成了一个缩小版的“电子助理”,能够实现人和耳机之间的对话,通过语音交互,来实现对于信息的获取。

2.因为算法推荐,耳机可以打造专属于你的“私人FM”

大数据是AI绕不过去的一个技术,也是人工智能的根基之一。当耳机加上了大数据,则可以通过历史记录的数据叠加、LBS定位等新数据获取,让你听到你想听的歌曲。

AI耳机一方面,可以通过对于收听数据的清洗、分析,把握用户对于音乐风格的取向,真正让每一个人都听到自己喜欢听的歌曲。另一方面,又可以通过传感器对于心率、步数等信息的抓取,配合时间、地点等基础信息,从而得出对于环境的判断,使音乐适配场景。

除此之外,智能相对论(微信id:aixdlun)认为,巨头和创业者如此积极“拥抱”AI耳机,还有两个方面的原因。

第一、耳机的使用场景具有更加广泛的适用性。

相对而言,音箱的使用场景固定,较为封闭,而耳机则具有便携的特点,可以随时随地嵌入任何场景之中,能够使人机交互的体验更为方便和快捷。比如,智能音箱的主要使用场景是在家里或办公室,那在骑行、运动、开车等场景中,AI耳机就能派上用场。

并且,随着AI耳机不再需要通过迁移主设备的信息来完成工作,能够独立运行,使其应用的场景和范围进一步扩大。在以往,AI耳机语音交互的实现,需要通过其他的硬件的支持,例如Airpods就需要手机的连接才能完成工作。而最近则出现了能够单独使用的耳机,即不需要外接设备即可完成语音的识别和控制工作。例如Vinci,可以直接实现播放歌曲、语音交互等功能。

第二、耳机的用户基础数庞大,AI耳机有可能顺利转移这批用户

根据智研咨询发布的《2017-2022年中国耳机市场运行态势及投资战略研究报告》显示,预计到2023年,除手机附赠之外的耳机出货量将达到4.6亿个。 正如FIIL耳机的联合创始人邬宁在接受采访时提到“AI在智能音箱中是决定性作用,是雪中送炭;而AI在耳机中更多是锦上添花。”

要想成为“爆款”,AI耳机还需迈过哪些坎?

再回答第二个问题,从项目来看,无论是Vinci、Google Pixel Buds、还是Mars、iBFree2等,都还处在萌芽时期,推出的产品并不多,市场也还待爆发。目前来看,智能相对论(微信id:aixdlun)AI耳机在爆发前还需面临几个问题:

一要增强续航能力,保持耳机的低消耗和长时间工作。

根据《2017上半年中国耳机市场ZDC调研报告》显示,无线耳机已经成为人们的关注重点。而就目前所发布的AI耳机来看,也几乎都是采用无线的形式,因此增强续航能力就显得更为重要。

二要提高语音的交互能力。

语音的交互包含了识别和判断两个方面,在这个过程之中至少有两个方面会产生较大干扰。其一是环境的嘈杂声音,导致识别的混乱。当然,这个目前有了解决路径,vinci采用了骨传导的方式,来减轻环境的干扰。其二则是对于语义的理解。不同于拉丁语系语言,汉字的语言中存在大量的多音字、多义字和通假字,尤其是在不同的语言环境下,同一个字或同一个词组,都可能代表数种甚至数十种截然不同的含义。因此,对于中国的技术开发者来说这仍是摆在面前的一个巨大难题。

三要适用更多碎片化的场景以及改变用户认知。

目前多数消费者仍然是把AI耳机和运动耳机等传统耳机相提并论。尽管AI耳机因其体格小、移动性强、携带方便,在多数场景下优势明显。但相对而言,价格并不占有优势,尤其是目前主打的功能并没有形成颠覆性的变化,也没有给用户带来特别差异性的体验,所以要说服消费者扔掉自己现有的耳机换成AI耳机,还有些困难。

这样一来,AI耳机要么强化场景的差异,比如在户外旅游的场景中,个别AI耳机开始主打实时翻译的功能,实现了普通耳机不能实现的功能。可以预见,短期内,那些比较注重场景的垂直分化性的耳机会更受欢迎,比如专门的降噪耳机、语言翻译耳机等。或者找到更多其他碎片化使用场景,不与其他耳机直接竞争,比如噪音较大的工厂场景,网络信号不好的地下场景等。

要么改变消费认知,将AI耳机完全区别于传统耳机,形成新的品类,Vinci就宣称自己是“社交智能头机”,但这种新品类词或者行业词还不是一个创业公司能培养起来的。消费者认知的改变是一个革命性工程,需要时间和大的事件推动。

四要完成AI技术植入耳机的完美落地

尽管在大多数人眼里,耳机是一个相对技术含量不高的硬件品类,但AI耳机可不是谁都能玩得转的。涉及的声音输入输出算法、语音交互OS、场景识别及适配、实时翻译等AI技术都有极大的门槛,尤其是使用场景极其复杂的情况下,对技术更是一大考验。虽然目前创业公司正在干的最重要的一件事就是将AI技术植入耳机,比如Mobius说采用了科大讯飞 AIUI 的上下文对话场景智能识别技术,集成智能语义断句解决方案;VINCI耳机宣称自己拥有独创的近场声音输入输出算法、中英文泛娱乐语音对话交互OS、独立计算设备(机器人);亚马逊也在2016年8月申请过一款降噪耳机的专利,但到底能否完美落地最终还是用户体验说了算。

总之,当AI浪潮席卷到音频行业之时,厂商仍然要清楚,利用人们的好奇和从众心理,短期获利不是难事。但是要想得到长期的利润,探究人们的需要,将产品完整嵌入人们的生活之中才是关键。


【作者:智能相对论(微信id:aixdlun)】


这篇关于AI耳机要想“复制”智能音箱的爆红,还要迈过哪些坎?的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/531361

相关文章

Ilya-AI分享的他在OpenAI学习到的15个提示工程技巧

Ilya(不是本人,claude AI)在社交媒体上分享了他在OpenAI学习到的15个Prompt撰写技巧。 以下是详细的内容: 提示精确化:在编写提示时,力求表达清晰准确。清楚地阐述任务需求和概念定义至关重要。例:不用"分析文本",而用"判断这段话的情感倾向:积极、消极还是中性"。 快速迭代:善于快速连续调整提示。熟练的提示工程师能够灵活地进行多轮优化。例:从"总结文章"到"用

AI绘图怎么变现?想做点副业的小白必看!

在科技飞速发展的今天,AI绘图作为一种新兴技术,不仅改变了艺术创作的方式,也为创作者提供了多种变现途径。本文将详细探讨几种常见的AI绘图变现方式,帮助创作者更好地利用这一技术实现经济收益。 更多实操教程和AI绘画工具,可以扫描下方,免费获取 定制服务:个性化的创意商机 个性化定制 AI绘图技术能够根据用户需求生成个性化的头像、壁纸、插画等作品。例如,姓氏头像在电商平台上非常受欢迎,

从去中心化到智能化:Web3如何与AI共同塑造数字生态

在数字时代的演进中,Web3和人工智能(AI)正成为塑造未来互联网的两大核心力量。Web3的去中心化理念与AI的智能化技术,正相互交织,共同推动数字生态的变革。本文将探讨Web3与AI的融合如何改变数字世界,并展望这一新兴组合如何重塑我们的在线体验。 Web3的去中心化愿景 Web3代表了互联网的第三代发展,它基于去中心化的区块链技术,旨在创建一个开放、透明且用户主导的数字生态。不同于传统

AI一键生成 PPT

AI一键生成 PPT 操作步骤 作为一名打工人,是不是经常需要制作各种PPT来分享我的生活和想法。但是,你们知道,有时候灵感来了,时间却不够用了!😩直到我发现了Kimi AI——一个能够自动生成PPT的神奇助手!🌟 什么是Kimi? 一款月之暗面科技有限公司开发的AI办公工具,帮助用户快速生成高质量的演示文稿。 无论你是职场人士、学生还是教师,Kimi都能够为你的办公文

Andrej Karpathy最新采访:认知核心模型10亿参数就够了,AI会打破教育不公的僵局

夕小瑶科技说 原创  作者 | 海野 AI圈子的红人,AI大神Andrej Karpathy,曾是OpenAI联合创始人之一,特斯拉AI总监。上一次的动态是官宣创办一家名为 Eureka Labs 的人工智能+教育公司 ,宣布将长期致力于AI原生教育。 近日,Andrej Karpathy接受了No Priors(投资博客)的采访,与硅谷知名投资人 Sara Guo 和 Elad G

嵌入式QT开发:构建高效智能的嵌入式系统

摘要: 本文深入探讨了嵌入式 QT 相关的各个方面。从 QT 框架的基础架构和核心概念出发,详细阐述了其在嵌入式环境中的优势与特点。文中分析了嵌入式 QT 的开发环境搭建过程,包括交叉编译工具链的配置等关键步骤。进一步探讨了嵌入式 QT 的界面设计与开发,涵盖了从基本控件的使用到复杂界面布局的构建。同时也深入研究了信号与槽机制在嵌入式系统中的应用,以及嵌入式 QT 与硬件设备的交互,包括输入输出设

让树莓派智能语音助手实现定时提醒功能

最初的时候是想直接在rasa 的chatbot上实现,因为rasa本身是带有remindschedule模块的。不过经过一番折腾后,忽然发现,chatbot上实现的定时,语音助手不一定会有响应。因为,我目前语音助手的代码设置了长时间无应答会结束对话,这样一来,chatbot定时提醒的触发就不会被语音助手获悉。那怎么让语音助手也具有定时提醒功能呢? 我最后选择的方法是用threading.Time

AI hospital 论文Idea

一、Benchmarking Large Language Models on Communicative Medical Coaching: A Dataset and a Novel System论文地址含代码 大多数现有模型和工具主要迎合以患者为中心的服务。这项工作深入探讨了LLMs在提高医疗专业人员的沟通能力。目标是构建一个模拟实践环境,人类医生(即医学学习者)可以在其中与患者代理进行医学

AI行业应用(不定期更新)

ChatPDF 可以让你上传一个 PDF 文件,然后针对这个 PDF 进行小结和提问。你可以把各种各样你要研究的分析报告交给它,快速获取到想要知道的信息。https://www.chatpdf.com/

【北交大信息所AI-Max2】使用方法

BJTU信息所集群AI_MAX2使用方法 使用的前提是预约到相应的算力卡,拥有登录权限的账号密码,一般为导师组共用一个。 有浏览器、ssh工具就可以。 1.新建集群Terminal 浏览器登陆10.126.62.75 (如果是1集群把75改成66) 交互式开发 执行器选Terminal 密码随便设一个(需记住) 工作空间:私有数据、全部文件 加速器选GeForce_RTX_2080_Ti