AI耳机要想“复制”智能音箱的爆红,还要迈过哪些坎?

2023-12-24 09:38

本文主要是介绍AI耳机要想“复制”智能音箱的爆红,还要迈过哪些坎?,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

如果说智能音箱的爆红,是在情理之中,那最近大伙儿扎堆AI耳机是不是在意料之外呢?

先说海外的,2017年10月谷歌公布Pixel Buds耳机,被认为是业内首个真正意义上的“智能耳机”。其最大亮点是整合了谷歌语音助理,用户通过特定手势激活它后可获取线路,设定提醒或者控制音乐等,与Pixel配对后还能实时翻译。

随后的11月,Line也发布了一款AI耳机MARS,可即时翻译10种语言,不同语言两人一人戴上一只,就可自由交流。而澳大利亚初创公司Lingmo先于2017年6月发布了一款翻译耳机“Translate One2One”,支持8种语言,3~5秒钟即可完成翻译。

此外还有苹果的AirPods、三星推出的Gear Iconx( 2018 )无线耳机、索尼Xperia Ear智能耳机等,语音巨头亚马逊早在 2016 年 8 月也申请过一款降噪耳机的专利,据说目前也正在研发打磨一款智能语音耳机。

再说国内,先是汪峰主导的FIIL耳机牵手百度 DuerOS 推出了 FIIL 随身星,将耳机贴上了AI的标签;接着FIIL的“老对手”1MORE(万魔耳机)也推出了自家的 AI 耳机 iBFree 2。

于此同时,咪咕公司与科大讯飞联合推出了智能耳机莫比斯,其具备语音对话、运动监测、智能翻译、出行导航等四大功能,并在12月18号上线京东众筹。而在刚刚结束的中国创新创业大赛首届智慧家庭专业赛总决赛上,总冠军就是美国麻省理工学院两位校友David朱大卫和Max武巍创立的Vinci耳机项目。

AI耳机的想象空间在哪?真能和智能音箱一样爆红吗?

AI连上耳机后,AI耳机就是电子助理+私人FM?

我们先来回答第一个问题,尽管对于智能音箱和AI耳机,还没有明确的标准和定义。但是,通过对已经推出的相关产品进行分析后,我们可以看出人机交互以及算法推荐是AI耳机最基本和最突出的特点。

1.因为人机交互,耳机成了缩小版的“电子助理”

AI耳机无论是从手持,发展到头戴、耳塞和后挂,还是从动圈,发展到动铁、圈铁,其佩戴方式和扬声器的变化对于人们的生活来说其实并没有突破性的变革,因为它仍旧是一个音频传输器。而搭载人工智能之后,它变成了一个缩小版的“电子助理”,能够实现人和耳机之间的对话,通过语音交互,来实现对于信息的获取。

2.因为算法推荐,耳机可以打造专属于你的“私人FM”

大数据是AI绕不过去的一个技术,也是人工智能的根基之一。当耳机加上了大数据,则可以通过历史记录的数据叠加、LBS定位等新数据获取,让你听到你想听的歌曲。

AI耳机一方面,可以通过对于收听数据的清洗、分析,把握用户对于音乐风格的取向,真正让每一个人都听到自己喜欢听的歌曲。另一方面,又可以通过传感器对于心率、步数等信息的抓取,配合时间、地点等基础信息,从而得出对于环境的判断,使音乐适配场景。

除此之外,智能相对论(微信id:aixdlun)认为,巨头和创业者如此积极“拥抱”AI耳机,还有两个方面的原因。

第一、耳机的使用场景具有更加广泛的适用性。

相对而言,音箱的使用场景固定,较为封闭,而耳机则具有便携的特点,可以随时随地嵌入任何场景之中,能够使人机交互的体验更为方便和快捷。比如,智能音箱的主要使用场景是在家里或办公室,那在骑行、运动、开车等场景中,AI耳机就能派上用场。

并且,随着AI耳机不再需要通过迁移主设备的信息来完成工作,能够独立运行,使其应用的场景和范围进一步扩大。在以往,AI耳机语音交互的实现,需要通过其他的硬件的支持,例如Airpods就需要手机的连接才能完成工作。而最近则出现了能够单独使用的耳机,即不需要外接设备即可完成语音的识别和控制工作。例如Vinci,可以直接实现播放歌曲、语音交互等功能。

第二、耳机的用户基础数庞大,AI耳机有可能顺利转移这批用户

根据智研咨询发布的《2017-2022年中国耳机市场运行态势及投资战略研究报告》显示,预计到2023年,除手机附赠之外的耳机出货量将达到4.6亿个。 正如FIIL耳机的联合创始人邬宁在接受采访时提到“AI在智能音箱中是决定性作用,是雪中送炭;而AI在耳机中更多是锦上添花。”

要想成为“爆款”,AI耳机还需迈过哪些坎?

再回答第二个问题,从项目来看,无论是Vinci、Google Pixel Buds、还是Mars、iBFree2等,都还处在萌芽时期,推出的产品并不多,市场也还待爆发。目前来看,智能相对论(微信id:aixdlun)AI耳机在爆发前还需面临几个问题:

一要增强续航能力,保持耳机的低消耗和长时间工作。

根据《2017上半年中国耳机市场ZDC调研报告》显示,无线耳机已经成为人们的关注重点。而就目前所发布的AI耳机来看,也几乎都是采用无线的形式,因此增强续航能力就显得更为重要。

二要提高语音的交互能力。

语音的交互包含了识别和判断两个方面,在这个过程之中至少有两个方面会产生较大干扰。其一是环境的嘈杂声音,导致识别的混乱。当然,这个目前有了解决路径,vinci采用了骨传导的方式,来减轻环境的干扰。其二则是对于语义的理解。不同于拉丁语系语言,汉字的语言中存在大量的多音字、多义字和通假字,尤其是在不同的语言环境下,同一个字或同一个词组,都可能代表数种甚至数十种截然不同的含义。因此,对于中国的技术开发者来说这仍是摆在面前的一个巨大难题。

三要适用更多碎片化的场景以及改变用户认知。

目前多数消费者仍然是把AI耳机和运动耳机等传统耳机相提并论。尽管AI耳机因其体格小、移动性强、携带方便,在多数场景下优势明显。但相对而言,价格并不占有优势,尤其是目前主打的功能并没有形成颠覆性的变化,也没有给用户带来特别差异性的体验,所以要说服消费者扔掉自己现有的耳机换成AI耳机,还有些困难。

这样一来,AI耳机要么强化场景的差异,比如在户外旅游的场景中,个别AI耳机开始主打实时翻译的功能,实现了普通耳机不能实现的功能。可以预见,短期内,那些比较注重场景的垂直分化性的耳机会更受欢迎,比如专门的降噪耳机、语言翻译耳机等。或者找到更多其他碎片化使用场景,不与其他耳机直接竞争,比如噪音较大的工厂场景,网络信号不好的地下场景等。

要么改变消费认知,将AI耳机完全区别于传统耳机,形成新的品类,Vinci就宣称自己是“社交智能头机”,但这种新品类词或者行业词还不是一个创业公司能培养起来的。消费者认知的改变是一个革命性工程,需要时间和大的事件推动。

四要完成AI技术植入耳机的完美落地

尽管在大多数人眼里,耳机是一个相对技术含量不高的硬件品类,但AI耳机可不是谁都能玩得转的。涉及的声音输入输出算法、语音交互OS、场景识别及适配、实时翻译等AI技术都有极大的门槛,尤其是使用场景极其复杂的情况下,对技术更是一大考验。虽然目前创业公司正在干的最重要的一件事就是将AI技术植入耳机,比如Mobius说采用了科大讯飞 AIUI 的上下文对话场景智能识别技术,集成智能语义断句解决方案;VINCI耳机宣称自己拥有独创的近场声音输入输出算法、中英文泛娱乐语音对话交互OS、独立计算设备(机器人);亚马逊也在2016年8月申请过一款降噪耳机的专利,但到底能否完美落地最终还是用户体验说了算。

总之,当AI浪潮席卷到音频行业之时,厂商仍然要清楚,利用人们的好奇和从众心理,短期获利不是难事。但是要想得到长期的利润,探究人们的需要,将产品完整嵌入人们的生活之中才是关键。


【作者:智能相对论(微信id:aixdlun)】


这篇关于AI耳机要想“复制”智能音箱的爆红,还要迈过哪些坎?的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/531361

相关文章

基于Flask框架添加多个AI模型的API并进行交互

《基于Flask框架添加多个AI模型的API并进行交互》:本文主要介绍如何基于Flask框架开发AI模型API管理系统,允许用户添加、删除不同AI模型的API密钥,感兴趣的可以了解下... 目录1. 概述2. 后端代码说明2.1 依赖库导入2.2 应用初始化2.3 API 存储字典2.4 路由函数2.5 应

Spring AI ectorStore的使用流程

《SpringAIectorStore的使用流程》SpringAI中的VectorStore是一种用于存储和检索高维向量数据的数据库或存储解决方案,它在AI应用中发挥着至关重要的作用,本文给大家介... 目录一、VectorStore的基本概念二、VectorStore的核心接口三、VectorStore的

通过Python脚本批量复制并规范命名视频文件

《通过Python脚本批量复制并规范命名视频文件》本文介绍了如何通过Python脚本批量复制并规范命名视频文件,实现自动补齐数字编号、保留原始文件、智能识别有效文件等功能,听过代码示例介绍的非常详细,... 目录一、问题场景:杂乱的视频文件名二、完整解决方案三、关键技术解析1. 智能路径处理2. 精准文件名

使用Python实现表格字段智能去重

《使用Python实现表格字段智能去重》在数据分析和处理过程中,数据清洗是一个至关重要的步骤,其中字段去重是一个常见且关键的任务,下面我们看看如何使用Python进行表格字段智能去重吧... 目录一、引言二、数据重复问题的常见场景与影响三、python在数据清洗中的优势四、基于Python的表格字段智能去重

Spring AI集成DeepSeek三步搞定Java智能应用的详细过程

《SpringAI集成DeepSeek三步搞定Java智能应用的详细过程》本文介绍了如何使用SpringAI集成DeepSeek,一个国内顶尖的多模态大模型,SpringAI提供了一套统一的接口,简... 目录DeepSeek 介绍Spring AI 是什么?Spring AI 的主要功能包括1、环境准备2

Spring AI集成DeepSeek实现流式输出的操作方法

《SpringAI集成DeepSeek实现流式输出的操作方法》本文介绍了如何在SpringBoot中使用Sse(Server-SentEvents)技术实现流式输出,后端使用SpringMVC中的S... 目录一、后端代码二、前端代码三、运行项目小天有话说题外话参考资料前面一篇文章我们实现了《Spring

Spring AI与DeepSeek实战一之快速打造智能对话应用

《SpringAI与DeepSeek实战一之快速打造智能对话应用》本文详细介绍了如何通过SpringAI框架集成DeepSeek大模型,实现普通对话和流式对话功能,步骤包括申请API-KEY、项目搭... 目录一、概述二、申请DeepSeek的API-KEY三、项目搭建3.1. 开发环境要求3.2. mav

C#集成DeepSeek模型实现AI私有化的流程步骤(本地部署与API调用教程)

《C#集成DeepSeek模型实现AI私有化的流程步骤(本地部署与API调用教程)》本文主要介绍了C#集成DeepSeek模型实现AI私有化的方法,包括搭建基础环境,如安装Ollama和下载DeepS... 目录前言搭建基础环境1、安装 Ollama2、下载 DeepSeek R1 模型客户端 ChatBo

Python3脚本实现Excel与TXT的智能转换

《Python3脚本实现Excel与TXT的智能转换》在数据处理的日常工作中,我们经常需要将Excel中的结构化数据转换为其他格式,本文将使用Python3实现Excel与TXT的智能转换,需要的可以... 目录场景应用:为什么需要这种转换技术解析:代码实现详解核心代码展示改进点说明实战演练:从Excel到

linux如何复制文件夹并重命名

《linux如何复制文件夹并重命名》在Linux系统中,复制文件夹并重命名可以通过使用“cp”和“mv”命令来实现,使用“cp-r”命令可以递归复制整个文件夹及其子文件夹和文件,而使用“mv”命令可以... 目录linux复制文件夹并重命名我们需要使用“cp”命令来复制文件夹我们还可以结合使用“mv”命令总