芯片“自”造:智能音箱从支点到拼图的进阶史

2023-12-24 08:32

本文主要是介绍芯片“自”造:智能音箱从支点到拼图的进阶史,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

文 |李永华

来源|智能相对论(aixdlun)

智能音箱这次把炮火打到了“芯片”战场。

2019年第四季度,根据Strategy Analytics、Canalys等市场调研机构公布的智能音箱市场数据,小度以1900万年度出货量位居行业第一且增速最快,其中在带屏音箱领域领先幅度较大,天猫精灵、小米位列二三。

当外界以为,2020年各大头部厂商会使尽招数继续死磕出货量时,领先的百度又回归技术,在芯片上下起了工夫:最新发布的新一代智能音箱——小度智能音箱2 红外版,搭载的是百度首款针对远场语音交互研发的鸿鹄芯片,在唤醒、识别及功耗等方面让行业眼前一亮,尤其高躁音下首次唤醒率提升了10%以上,业内人士或许更了解这个数字意味着什么,达到一定程度后这一指标再提升1%都很难。

这令人意外但又在意料之中——站在技术制高点,沿着技术路线上把产品做到极致,从市场引领,到技术引领,是一贯的“百度式”做法。

虽然是一款无屏智能音箱,却让外界看到了跨越式的性能提升。百度副总裁景鲲曾对小度如何领跑智能音箱赛道给出了产品体验、品牌效应、开拓渠道、探索商业化的“四大飞轮”谋局,显然,从芯片切入,以产品性能带来“用户体验”的提升,也是四大飞轮的体现之一。

在卓越的性能提升面前,“用户体验”这个飞轮发生质的变化,当百度鸿鹄芯片在小度全系列产品应用之后,会引起行业什么样的反响?行业下一步的竞争会走向何方,同行业玩家的“跟随”还会继续、还能继续吗?

“智能相对论”认为,个案上,百度小度通过搭载一块自造的芯片完成了属于自己的智能拼图,为两年的发展历程划上了阶段性句号,而行业角度,芯片自造暴露出各玩家发展路径差异化已经十分明显,这种差异将继续深化下去。

一、发展两年后,智能音箱完成最后一块“智能拼图”

拆解智能音箱的发展状况,无非从这四个方面着手:底层硬件、产品形态、交互体验以及内容服务。

过去两年,智能音箱后三块拼图的样子基本都被描绘出来,现在回到了最基础的底层硬件上。

1、产品形态:总是距离半步的行业竞逐

如果我们回顾小度各产品的推出过程,过去两年是典型的产品形态“交错式”推进:

2018年3月,国内率先发布带屏产品“小度在家”;

2018年6月,发布无屏小度智能音箱,随后11月发布小度智能音箱Pro;

2019年2月,小度在家1S发布,4月,小度智能音箱1S发布,7月发布了针对年轻人的新品Play;

2019年12月,带屏新品类智能屏X8发布,2020年3月底智能屏Air发布;

现在,又轮到无屏产品,主打芯片自造的小度智能音箱2 红外版发布。

这里不是要记流水账,从时间线上,如果把行业玩家放在一起对比,就可以在带屏领域发现非常有意思的“距离半步”现象:

小度带屏产品真正意义上广受欢迎的小度在家1S发布在2019年2月,随即小米发布了小米小爱触屏音箱,两个月后,天猫精灵春节发布会发布其首款带屏产品天猫精灵CC;

然后,天猫不断发力带屏产品,9月推出天猫精灵CCL、11月推出天猫精灵CCH,而12月,百度却不再通过“带屏”概念应招,而直接以小度在家智能屏X8进行智能屏的“品类”升维竞争,定义AI智能交互、AI智能理解、内容服务新生态“智能屏三大要素”,把带屏产品的内涵和外延进行了扩充和固定,到今年3月,小度在家智能屏Air巩固了这种升维竞争。

 

很明显,一方面,小度用两年时间构建起自己完整的产品形态布局,另一方面,总是领先竞争者半步让小度在带屏产品方面成为绝对的领导者,天猫精灵成为跟随者,跟了一次的小米甚至有掉队的危险。

2、交互体验:方式更多+效果提升并行

交互体验包括两个方面,一是交互方式的丰富,二是交互效果的提升,两年时间,智能音箱两条腿走路,框架和深度能力都已经建立。

在交互方式方面,2019年7月,小度在家上线全双工免唤醒能力,意味着智能音箱进入全双工语音交互时代;此外,横向类型上,12月智能屏X8的推出,也是远场语音交互、人脸识别、手势控制、眼神唤醒多种交互方式碰撞的体现。

快速识别“童脸”、手势隔空控制播放/暂停、一个眼神唤醒……在智能音箱上,用户的交互选择越来越多,也越来越随意和自然。

到了2020年,交互方式还在发生新的变化,3月初小度音箱上线了语音定制功能,即通过某些简单的操作让智能音箱的音色变成自己或家人的声音,这使得智能音箱成为更有亲和力的产品。

当然,在交互方式升级过程中,行业的追逐仍然存在,多样化的交互方式继小度后都逐步成为各家的标配,而小度语音定制功能推出后不久,小米也发布了自己的定制功能。

而在交互效果的提升方面,进步一直有,但大跨步的进步,可能要等到这次小度搭载百度自造芯片才算。

根据百度实验室的测试结果,在安静环境2.5米距离内,小度智能音箱2 红外版360°识别字准率达99%,这一数据比第一代小度智能音箱高2%,比市场上其他品牌智能音箱产品高10%,而句准率95%更是高出竞品24%;在家庭电视噪声环境2.5米距离下,这一对比更加明显:小度智能音箱2 红外版360°识别字准率95%、句准率88%,分别较竞品提升了40%、75%。

 

智能音箱的交互效果提升,可能藉由芯片,在一个新的高台重新开始。

3、内容服务:颗粒度竞赛完成初步赛程

不得不承认的是,在小度在家刚刚推出时,产品形态仍然是创新和竞争的主基调,因而内容服务不算深入。

官方当时称“集成了海量音乐曲库及热播剧集电影综艺节目,有1400万个百科知识,搭载爱奇艺电影和百度音乐等”,以现在的目光看,不算太丰富。

对比当前小度智能音箱全系产品的内容服务:

覆盖游戏娱乐、医疗健康、教育、购物、社交、生活服务等场景,有快手、抖音、B站、优酷、全民K歌、喜马拉雅、荔枝直播等热门内容源,满足0-12岁儿童群体、90后/95后Z世代人群、中老年人群等不同年龄阶段需求。

 

过去两年,以小度为代表,智能音箱的内容服务呈现由单场景到多场景、来源越来越多样化(例如小程序)的颗粒度细化路径,到智能屏X8开始,由于内容服务生态被定义为品类的构成要件之一,智能音箱的内容服务快速完成了全年龄、全场景、全功能(主要指快递、外卖、购物等生活服务)的框架构建,后续的颗粒度细化将进一步加速。

回过头来看,智能音箱在产品形态、交互体验以及内容服务都完成了某种阶段性的发展进程,最基础的底层硬件却一直没有大的突破。

在小度智能音箱2 红外版之前,小度全系产品与行业其他玩家一样搭载的是ARM CPU解决方案,这是一种物联网通用CPU架构,从技术上说,运行AI算法还需要某些转换过程。

 

百度鸿鹄打通数字信号处理与语音识别实现端到端一体建模识别,改变了智能音箱需要借助通用芯片方案的尴尬处境,作为原生适应AI语音算法的芯片,对上述产品形态、交互体验、内容服务进行更大发挥有不言而喻的价值。

软件的进步永远是性能榨取式的,只有硬件才能根本上实现质的飞跃,芯片是智能音箱“智能拼图”不可或缺的一块,百度鸿鹄把它补上了,但这仅仅是个好的开始。

二、芯片“自”造,意味着智能音箱行业赛道正式分野?

盘点两年的发展,在鸿鹄出现在智能音箱前,行业的其实已经有赛道选择的差别,随着智能拼图最后一块的完成,智能音箱行业赛道可能也正式分野,不同的发展模式、不同的发展目标、不同的价值定位,都清晰表现出来。

1、技术发展上,“突破性技术创新”与“延续性技术创新”两派泾渭分明

顾名思义,与过去全然不同、发生质的飞跃的技术内容创新,称作“突破性技术创新”,而只是把已有的技术拿来借用,或者修修补补,就是“延续性技术创新”。

以语音定制为例,小度智能音箱的能力来源于百度AI的语音能力,在硬件产品之前,百度地图就已经在使用,百度自我完成了语音定制的突破性技术创新。

而小米采取的方式是与“深声科技”合作获取声音克隆技术,“借技术”进行交互体验升级,这只是一种延续。同样的,在全双工语音交互、手势识别、眼神唤醒等方面,这种自我突破与借用技术的分别,在包括天猫精灵在内的行业里一直十分明显。

而到了百度鸿鹄芯片这里,“突破性技术创新”与“延续性技术创新”则泾渭分明,原生AI算法架构与通用ARM架构的技术区别不用多说。

2、场景应用上,跨场景兼容与垂直场景深耕“人各有志”

天猫精灵最近了开发了AI美肤技术(这是一种图像优化技术的“延续”)并推出智能音箱基础上的智能美妆镜概念产品,此外,阿里深谙的电商类语音识别和需求满足能力同样在天猫精灵上有很好的展示,语音购成为重要亮点。

而小米则醉心于智能家居的全连接,尽管这个能力似乎各大竞品都已经天然具备,有些做得不比小米差,只是自有硬件没有小米生态丰富。

这些都说明,它们没有改变旧有的场景印记,天猫的美妆、购物场景是老本行,小米生态也是其“资本故事”的重要来源。

而与此对应的是,过去两年,百度小度没有“原生场景”的负累,以底层化的平台方式超越了场景限制,虽然已经有了儿童教育场景的强势,但从众多场景的覆盖状况看,小度的目标是完成全场景的渗透,这其中,由于平台需要适应多样化的场景内容与交互方式,适应不同情形下用户流畅体验的需求,一颗原生绑定AI算法的芯片就显得尤为重要,也是全场景能力的重要标志。

3、行业站位上,独立生态与AIoT环节两种价值定位凸显

如果只是服务于单个场景,借用一些延续性的技术进行创新,智能音箱的最终“归宿”必然是成为AIoT生态的一个环节。

这两年,天猫精灵服务于新消费生态的痕迹越来越浓,而小爱同学还在与小米手机谁来当“控制核心”的地位问题僵持中。

小度似乎打造了独属于智能音箱的完整生态,与智能手机一样,硬件终端品牌+各路内容服务商,共同服务于多样化的场景,构成生态的闭环。

随着芯片尘埃落定,小度下一步或许是把内容服务做成智能手机那样的开放式安装模式,而不是当前以官方合作模式为主。同样地,凡事有利有弊,如果只是做AIoT环节,智能音箱能够借助平台和链条的力量做市场渗透,而做独立生态,自己就是平台就是链条,实现市场渗透投入的资源要更多。

当然,必须说明的是,成为智能家居AIoT生态核心也是小度附带的、必带的能力。此次的新品小度智能音箱2红外版自带360°红外发射器,支持超过99%的红外家电,空调、风扇、电视、灯具等传统家电可直接纳入“全屋智能生活”体系当中。到目前为止,小度智能音箱已连接超过1.1亿台设备,覆盖400多个家电品牌,国民智能家居生活“标配”的地位确立。

三、销量竞赛仍在继续,但智能音箱玩家回归各自生态

这两年,小度逐步占据智能音箱出货量的头把交椅,也曾经占据过带屏音箱出货量遥遥领先的绝对优势,现在仍然在带屏领域是领导者。

而小度智能音箱2红外版的推出,也可以看作是借芯片巩固无屏产品优势的行为,高性能语音体验智、更省电节能环保等标签下,音箱在国民产品中更进一步。

两年后,行业这场销量的竞赛仍然在继续,但是,正如前文所言,不同玩家的“追求”显露出明显的差异,各自的侧重点发生变化。

一个就是要购物的用户可能会下意识选择天猫精灵,小米粉、全屋小米生态的极客们当然会选择小爱同学,一个希望通过智能音箱享受多方位服务的用户可能会选择小度……这是行业玩家心中的理想状态。但凡事都在变化,随着小度生态的逐步完善,语音购(京东及第三方服务商)等内容或服务功能的接入,IoT落地规模和产品控制力的增强,一个独立全场景智能音箱生态也会自然完成对购物、IoT场景的渗透。

总得来看,销量上的竞争仍然激烈,但智能音箱玩家因为路径的不同,场景发生不同程度的分化,从各个场景出发“一起做大蛋糕”的行业竞争氛围逐步形成,行业整体发展状况比过去更加良性。

而从更长远的视角看,将智能音箱打造成与智能手机类似的全场景生态的做法,使得小度这样的品牌最终将逐步渗透竞品原来的优势场景,实现市场的全面占领,从而使得智能音箱在成为国民产品后,还可能走入单一品牌“一统天下”的格局。

不妨拭目以待。

此内容为【智能相对论】原创,

仅代表个人观点,未经授权,任何人不得以任何方式使用,包括转载、摘编、复制或建立镜像。

部分图片来自网络,且未核实版权归属,不作为商业用途,如有侵犯,请作者与我们联系。

智能相对论(微信ID:aixdlun):

•AI产业新媒体;

•今日头条青云计划获奖者TOP10;

•澎湃新闻科技榜单月度top5;

•文章长期“霸占”钛媒体热门文章排行榜TOP10;

•著有《人工智能 十万个为什么》

•【重点关注领域】智能家电(含白电、黑电、智能手机、无人机等AIoT设备)、智能驾驶、AI+医疗、机器人、物联网、AI+金融、AI+教育、AR/VR、云计算、开发者以及背后的芯片、算法等。

这篇关于芯片“自”造:智能音箱从支点到拼图的进阶史的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/531190

相关文章

Spring Security 从入门到进阶系列教程

Spring Security 入门系列 《保护 Web 应用的安全》 《Spring-Security-入门(一):登录与退出》 《Spring-Security-入门(二):基于数据库验证》 《Spring-Security-入门(三):密码加密》 《Spring-Security-入门(四):自定义-Filter》 《Spring-Security-入门(五):在 Sprin

Java进阶13讲__第12讲_1/2

多线程、线程池 1.  线程概念 1.1  什么是线程 1.2  线程的好处 2.   创建线程的三种方式 注意事项 2.1  继承Thread类 2.1.1 认识  2.1.2  编码实现  package cn.hdc.oop10.Thread;import org.slf4j.Logger;import org.slf4j.LoggerFactory

嵌入式QT开发:构建高效智能的嵌入式系统

摘要: 本文深入探讨了嵌入式 QT 相关的各个方面。从 QT 框架的基础架构和核心概念出发,详细阐述了其在嵌入式环境中的优势与特点。文中分析了嵌入式 QT 的开发环境搭建过程,包括交叉编译工具链的配置等关键步骤。进一步探讨了嵌入式 QT 的界面设计与开发,涵盖了从基本控件的使用到复杂界面布局的构建。同时也深入研究了信号与槽机制在嵌入式系统中的应用,以及嵌入式 QT 与硬件设备的交互,包括输入输出设

让树莓派智能语音助手实现定时提醒功能

最初的时候是想直接在rasa 的chatbot上实现,因为rasa本身是带有remindschedule模块的。不过经过一番折腾后,忽然发现,chatbot上实现的定时,语音助手不一定会有响应。因为,我目前语音助手的代码设置了长时间无应答会结束对话,这样一来,chatbot定时提醒的触发就不会被语音助手获悉。那怎么让语音助手也具有定时提醒功能呢? 我最后选择的方法是用threading.Time

[MySQL表的增删改查-进阶]

🌈个人主页:努力学编程’ ⛅个人推荐: c语言从初阶到进阶 JavaEE详解 数据结构 ⚡学好数据结构,刷题刻不容缓:点击一起刷题 🌙心灵鸡汤:总有人要赢,为什么不能是我呢 💻💻💻数据库约束 🔭🔭🔭约束类型 not null: 指示某列不能存储 NULL 值unique: 保证某列的每行必须有唯一的值default: 规定没有给列赋值时的默认值.primary key:

智能交通(二)——Spinger特刊推荐

特刊征稿 01  期刊名称: Autonomous Intelligent Systems  特刊名称: Understanding the Policy Shift  with the Digital Twins in Smart  Transportation and Mobility 截止时间: 开放提交:2024年1月20日 提交截止日

【Linux 从基础到进阶】Ansible自动化运维工具使用

Ansible自动化运维工具使用 Ansible 是一款开源的自动化运维工具,采用无代理架构(agentless),基于 SSH 连接进行管理,具有简单易用、灵活强大、可扩展性高等特点。它广泛用于服务器管理、应用部署、配置管理等任务。本文将介绍 Ansible 的安装、基本使用方法及一些实际运维场景中的应用,旨在帮助运维人员快速上手并熟练运用 Ansible。 1. Ansible的核心概念

Flutter 进阶:绘制加载动画

绘制加载动画:由小圆组成的大圆 1. 定义 LoadingScreen 类2. 实现 _LoadingScreenState 类3. 定义 LoadingPainter 类4. 总结 实现加载动画 我们需要定义两个类:LoadingScreen 和 LoadingPainter。LoadingScreen 负责控制动画的状态,而 LoadingPainter 则负责绘制动画。

基于 YOLOv5 的积水检测系统:打造高效智能的智慧城市应用

在城市发展中,积水问题日益严重,特别是在大雨过后,积水往往会影响交通甚至威胁人们的安全。通过现代计算机视觉技术,我们能够智能化地检测和识别积水区域,减少潜在危险。本文将介绍如何使用 YOLOv5 和 PyQt5 搭建一个积水检测系统,结合深度学习和直观的图形界面,为用户提供高效的解决方案。 源码地址: PyQt5+YoloV5 实现积水检测系统 预览: 项目背景

从0到1,AI我来了- (7)AI应用-ComfyUI-II(进阶)

上篇comfyUI 入门 ,了解了TA是个啥,这篇,我们通过ComfyUI 及其相关Lora 模型,生成一些更惊艳的图片。这篇主要了解这些内容:         1、哪里获取模型?         2、实践如何画一个美女?         3、附录:               1)相关SD(稳定扩散模型的组成部分)               2)模型放置目录(重要)