AI耳机要想“复制”智能音箱的爆红,还要迈过哪些坎?

2023-12-24 09:38

本文主要是介绍AI耳机要想“复制”智能音箱的爆红,还要迈过哪些坎?,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

如果说智能音箱的爆红,是在情理之中,那最近大伙儿扎堆AI耳机是不是在意料之外呢?

先说海外的,2017年10月谷歌公布Pixel Buds耳机,被认为是业内首个真正意义上的“智能耳机”。其最大亮点是整合了谷歌语音助理,用户通过特定手势激活它后可获取线路,设定提醒或者控制音乐等,与Pixel配对后还能实时翻译。

随后的11月,Line也发布了一款AI耳机MARS,可即时翻译10种语言,不同语言两人一人戴上一只,就可自由交流。而澳大利亚初创公司Lingmo先于2017年6月发布了一款翻译耳机“Translate One2One”,支持8种语言,3~5秒钟即可完成翻译。

此外还有苹果的AirPods、三星推出的Gear Iconx( 2018 )无线耳机、索尼Xperia Ear智能耳机等,语音巨头亚马逊早在 2016 年 8 月也申请过一款降噪耳机的专利,据说目前也正在研发打磨一款智能语音耳机。

再说国内,先是汪峰主导的FIIL耳机牵手百度 DuerOS 推出了 FIIL 随身星,将耳机贴上了AI的标签;接着FIIL的“老对手”1MORE(万魔耳机)也推出了自家的 AI 耳机 iBFree 2。

于此同时,咪咕公司与科大讯飞联合推出了智能耳机莫比斯,其具备语音对话、运动监测、智能翻译、出行导航等四大功能,并在12月18号上线京东众筹。而在刚刚结束的中国创新创业大赛首届智慧家庭专业赛总决赛上,总冠军就是美国麻省理工学院两位校友David朱大卫和Max武巍创立的Vinci耳机项目。

AI耳机的想象空间在哪?真能和智能音箱一样爆红吗?

AI连上耳机后,AI耳机就是电子助理+私人FM?

我们先来回答第一个问题,尽管对于智能音箱和AI耳机,还没有明确的标准和定义。但是,通过对已经推出的相关产品进行分析后,我们可以看出人机交互以及算法推荐是AI耳机最基本和最突出的特点。

1.因为人机交互,耳机成了缩小版的“电子助理”

AI耳机无论是从手持,发展到头戴、耳塞和后挂,还是从动圈,发展到动铁、圈铁,其佩戴方式和扬声器的变化对于人们的生活来说其实并没有突破性的变革,因为它仍旧是一个音频传输器。而搭载人工智能之后,它变成了一个缩小版的“电子助理”,能够实现人和耳机之间的对话,通过语音交互,来实现对于信息的获取。

2.因为算法推荐,耳机可以打造专属于你的“私人FM”

大数据是AI绕不过去的一个技术,也是人工智能的根基之一。当耳机加上了大数据,则可以通过历史记录的数据叠加、LBS定位等新数据获取,让你听到你想听的歌曲。

AI耳机一方面,可以通过对于收听数据的清洗、分析,把握用户对于音乐风格的取向,真正让每一个人都听到自己喜欢听的歌曲。另一方面,又可以通过传感器对于心率、步数等信息的抓取,配合时间、地点等基础信息,从而得出对于环境的判断,使音乐适配场景。

除此之外,智能相对论(微信id:aixdlun)认为,巨头和创业者如此积极“拥抱”AI耳机,还有两个方面的原因。

第一、耳机的使用场景具有更加广泛的适用性。

相对而言,音箱的使用场景固定,较为封闭,而耳机则具有便携的特点,可以随时随地嵌入任何场景之中,能够使人机交互的体验更为方便和快捷。比如,智能音箱的主要使用场景是在家里或办公室,那在骑行、运动、开车等场景中,AI耳机就能派上用场。

并且,随着AI耳机不再需要通过迁移主设备的信息来完成工作,能够独立运行,使其应用的场景和范围进一步扩大。在以往,AI耳机语音交互的实现,需要通过其他的硬件的支持,例如Airpods就需要手机的连接才能完成工作。而最近则出现了能够单独使用的耳机,即不需要外接设备即可完成语音的识别和控制工作。例如Vinci,可以直接实现播放歌曲、语音交互等功能。

第二、耳机的用户基础数庞大,AI耳机有可能顺利转移这批用户

根据智研咨询发布的《2017-2022年中国耳机市场运行态势及投资战略研究报告》显示,预计到2023年,除手机附赠之外的耳机出货量将达到4.6亿个。 正如FIIL耳机的联合创始人邬宁在接受采访时提到“AI在智能音箱中是决定性作用,是雪中送炭;而AI在耳机中更多是锦上添花。”

要想成为“爆款”,AI耳机还需迈过哪些坎?

再回答第二个问题,从项目来看,无论是Vinci、Google Pixel Buds、还是Mars、iBFree2等,都还处在萌芽时期,推出的产品并不多,市场也还待爆发。目前来看,智能相对论(微信id:aixdlun)AI耳机在爆发前还需面临几个问题:

一要增强续航能力,保持耳机的低消耗和长时间工作。

根据《2017上半年中国耳机市场ZDC调研报告》显示,无线耳机已经成为人们的关注重点。而就目前所发布的AI耳机来看,也几乎都是采用无线的形式,因此增强续航能力就显得更为重要。

二要提高语音的交互能力。

语音的交互包含了识别和判断两个方面,在这个过程之中至少有两个方面会产生较大干扰。其一是环境的嘈杂声音,导致识别的混乱。当然,这个目前有了解决路径,vinci采用了骨传导的方式,来减轻环境的干扰。其二则是对于语义的理解。不同于拉丁语系语言,汉字的语言中存在大量的多音字、多义字和通假字,尤其是在不同的语言环境下,同一个字或同一个词组,都可能代表数种甚至数十种截然不同的含义。因此,对于中国的技术开发者来说这仍是摆在面前的一个巨大难题。

三要适用更多碎片化的场景以及改变用户认知。

目前多数消费者仍然是把AI耳机和运动耳机等传统耳机相提并论。尽管AI耳机因其体格小、移动性强、携带方便,在多数场景下优势明显。但相对而言,价格并不占有优势,尤其是目前主打的功能并没有形成颠覆性的变化,也没有给用户带来特别差异性的体验,所以要说服消费者扔掉自己现有的耳机换成AI耳机,还有些困难。

这样一来,AI耳机要么强化场景的差异,比如在户外旅游的场景中,个别AI耳机开始主打实时翻译的功能,实现了普通耳机不能实现的功能。可以预见,短期内,那些比较注重场景的垂直分化性的耳机会更受欢迎,比如专门的降噪耳机、语言翻译耳机等。或者找到更多其他碎片化使用场景,不与其他耳机直接竞争,比如噪音较大的工厂场景,网络信号不好的地下场景等。

要么改变消费认知,将AI耳机完全区别于传统耳机,形成新的品类,Vinci就宣称自己是“社交智能头机”,但这种新品类词或者行业词还不是一个创业公司能培养起来的。消费者认知的改变是一个革命性工程,需要时间和大的事件推动。

四要完成AI技术植入耳机的完美落地

尽管在大多数人眼里,耳机是一个相对技术含量不高的硬件品类,但AI耳机可不是谁都能玩得转的。涉及的声音输入输出算法、语音交互OS、场景识别及适配、实时翻译等AI技术都有极大的门槛,尤其是使用场景极其复杂的情况下,对技术更是一大考验。虽然目前创业公司正在干的最重要的一件事就是将AI技术植入耳机,比如Mobius说采用了科大讯飞 AIUI 的上下文对话场景智能识别技术,集成智能语义断句解决方案;VINCI耳机宣称自己拥有独创的近场声音输入输出算法、中英文泛娱乐语音对话交互OS、独立计算设备(机器人);亚马逊也在2016年8月申请过一款降噪耳机的专利,但到底能否完美落地最终还是用户体验说了算。

总之,当AI浪潮席卷到音频行业之时,厂商仍然要清楚,利用人们的好奇和从众心理,短期获利不是难事。但是要想得到长期的利润,探究人们的需要,将产品完整嵌入人们的生活之中才是关键。


【作者:智能相对论(微信id:aixdlun)】


这篇关于AI耳机要想“复制”智能音箱的爆红,还要迈过哪些坎?的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/531361

相关文章

揭秘未来艺术:AI绘画工具全面介绍

📑前言 随着科技的飞速发展,人工智能(AI)已经逐渐渗透到我们生活的方方面面。在艺术创作领域,AI技术同样展现出了其独特的魅力。今天,我们就来一起探索这个神秘而引人入胜的领域,深入了解AI绘画工具的奥秘及其为艺术创作带来的革命性变革。 一、AI绘画工具的崛起 1.1 颠覆传统绘画模式 在过去,绘画是艺术家们通过手中的画笔,蘸取颜料,在画布上自由挥洒的创造性过程。然而,随着AI绘画工

一份LLM资源清单围观技术大佬的日常;手把手教你在美国搭建「百万卡」AI数据中心;为啥大模型做不好简单的数学计算? | ShowMeAI日报

👀日报&周刊合集 | 🎡ShowMeAI官网 | 🧡 点赞关注评论拜托啦! 1. 为啥大模型做不好简单的数学计算?从大模型高考数学成绩不及格说起 司南评测体系 OpenCompass 选取 7 个大模型 (6 个开源模型+ GPT-4o),组织参与了 2024 年高考「新课标I卷」的语文、数学、英语考试,然后由经验丰富的判卷老师评判得分。 结果如上图所

AI儿童绘本创作

之前分享过AI儿童绘画的项目,但是主要问题是角色一致要花费很长的时间! 今天发现了这款,非常奈斯! 只需输入故事主题、风格、模板,软件就会自动创作故事内容,自动生成插画配图,自动根据模板生成成品,测试效果如下图。 变现方式:生成儿童绘本发布到各平台,吸引宝妈群体进私域。  百度网盘 请输入提取码百度网盘为您提供文件的网络备份、同步和分享服务。空间大、速度快、安全

人工和AI大语言模型成本对比 ai语音模型

这里既有AI,又有生活大道理,无数渺小的思考填满了一生。 上一专题搭建了一套GMM-HMM系统,来识别连续0123456789的英文语音。 但若不是仅针对数字,而是所有普通词汇,可能达到十几万个词,解码过程将非常复杂,识别结果组合太多,识别结果不会理想。因此只有声学模型是完全不够的,需要引入语言模型来约束识别结果。让“今天天气很好”的概率高于“今天天汽很好”的概率,得到声学模型概率高,又符合表达

VirtualBox中,虚拟系统文件VDI移动或者复制

在安装virtualbox以后有时需要复制,移动虚拟磁盘等操作,这些操作在vmware的虚拟机下面可以直接操作虚拟磁盘即可使用,但是在virtualbox环境 下每个VDI 文件都有一个唯一的uuid,而VirtualBox 不允许注册重复的uuid,所以直接复制的VDI文件是不能拿来使用的,我们就需要使用到virtualbox自带的管理命令来克隆一个VDI,这样通过命令克隆的VDI文件会重

智能客服到个人助理,国内AI大模型如何改变我们的生活?

引言 随着人工智能(AI)技术的高速发展,AI大模型越来越多地出现在我们的日常生活和工作中。国内的AI大模型在过去几年里取得了显著的进展,不少独创的技术点和实际应用令人瞩目。 那么,国内的AI大模型有哪些独创的技术点?它们在实际应用中又有哪些出色表现呢?此外,普通人又该如何利用这些大模型提升工作和生活的质量和效率呢?本文将为你一一解析。 一、国内AI大模型的独创技术点 多模态学习 多

【新闻】AI程序员要来了吗?阿里云官宣

内容提要 6 月 21 日,在阿里云上海 AI 峰会上,阿里云宣布推出首个AI 程序员。 据介绍,这个AI程序员具备架构师、开发工程师、测试工程师等多种岗位的技能,能一站式自主完成任务分解、代码编写、测试、问题修复、代码提交整个过程,最快分钟级即可完成应用开发,大幅提升研发效率。 近段时间以来,有关AI的实践应用突破不断,全球开发者加速研发步伐。有业内人士坦言,随着大模型性能逐渐提升,AI应

基于 Java 实现的智能客服聊天工具模拟场景

服务端代码 import java.io.BufferedReader;import java.io.IOException;import java.io.InputStreamReader;import java.io.PrintWriter;import java.net.ServerSocket;import java.net.Socket;public class Serv

AI元宇宙

随着科技的迅猛发展,人工智能(AI)迎来了一个宇宙大爆发的时代。特别是以GPT为代表的生成式大模型的诞生和不断进步,彻底改变了人们的工作和生活方式。程序员与AI协同工作写代码已成为常态,大模型不仅提高了工作效率,还为人类带来了无限的可能性。 AI元宇宙http://ai.toolxq.com/#/如同生物进化出眼睛打开了三维世界的元宇宙之后,GPT打开了人+AI工作模式的新时代,程序员的人生被划

AI学习指南机器学习篇-朴素贝叶斯处理连续特征和离散特征

AI学习指南机器学习篇-朴素贝叶斯处理连续特征和离散特征 在机器学习领域,朴素贝叶斯是一种常用的分类算法,它的简单性和高效性使得它在实际应用中得到了广泛的应用。然而,在使用朴素贝叶斯算法进行分类时,我们通常会面临一个重要的问题,就是如何处理连续特征和离散特征。因为朴素贝叶斯算法基于特征的条件独立性假设,所以对于不同类型的特征,我们需要采取不同的处理方式。 在本篇博客中,我们将探讨如何有效地处理