语音入口大战升级!亚马逊Alexa放招:即插即用,霸占你所有空间

本文主要是介绍语音入口大战升级!亚马逊Alexa放招:即插即用,霸占你所有空间,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

来源:AI科技大本营(微信ID:rgznai100)

翻译 | 刘畅

编辑 | Donna,波波


大多数人都认为,智能音箱就是语音入口之争的主战场……比如双十一期间,阿里巴巴不惜血本也要99元强推天猫精灵,亏损数亿终于砸出中国智能音箱市场的第一个百万级销量。


但Echo销量超过2000万的亚马逊,却没这么想,它正大张旗鼓地把智能音箱的战火烧进其他市场。尽管此前,亚马逊Alexa与微软Cortana在功能上相互打通的计划因不明原因被推迟,但本届CES上,Alexa语音助手已确定要登陆惠普、宏碁和华硕的Windows电脑。


今天,汽车巨头丰田又宣布它的雷克萨斯和丰田车型将内置Alexa语音助手。此前,宝马、福特、日产、Jeep等品牌的最新车型已经都在使用Alexa,通过语音助手,车主可以远程启动或锁定车辆。在家居环境中,使用语音之外,我们还有很多其他的选择;但在汽车上,通过Alexa直接说话,无疑是更自然、更直接同时也是更为安全的一种交互方式。


如果所有的汽车都配备上语音助手,那出行场景势必将超越起居室而成为语音入口最重要的一环。尽管Google在展前表示过,Google Assistant已经出现在1500多种智能家居设备上,但亚马逊一把火将Alexa从音箱、电视、电冰箱、浴镜烧到可穿戴设备和汽车后……双方在设备制造商领域的竞争,逐渐将决定这场语音入口之战接下来的走势。


在这场角逐中,Alexa团队是怎么想的,他们在技术层面是如何部署的,他们又将准备如何去做到无处不在?对于这些问题,WIRED第一时间在CES 2018上采访Amazon的Alexa团队,并发布了《INSIDE THE LAB WHERE AMAZON'S ALEXA TAKES OVER THE WORLD》这篇文章,特地翻译出来为大家解惑:


亚马逊公司自己的产品之一,Echo扬声器,里面配套有Alexa语音助手


2014年,亚马逊首次推出语音助手Alexa时,只不过当它是一个实验性的产品。它最初是出现在Echo系列的产品里面,大家对它没什么期待,就是一个古怪、不知所云的小工具。


然而,当数百万人都开始在家中放置一个智能扬声器时,亚马逊看到了建立一个全新语音优先的计算平台的机会。无论你什么时间,在哪儿,在干什么事儿,你都可以通过语音助手控制家中的一切。从那时起,亚马逊就开始加速了他们的计划。


当亚马逊自己的团队在努力生产包括Echo Spot,Show,Dot,Plus等Echo系列产品时,另一个团队正在研发语音助手Alexa服务,还有别的团队在致力于构建到处都是Alexa的世界。当苹果和谷歌公司还在缓慢地开发自己的语音助手时,亚马逊已经开放了资源,让所有人都可以访问和使用自己开发的语音助手。


亚马逊知道,若想要成功,不能只在Echo系列产品上配备语音助手,毕竟Echo系列并不可能让每个人都喜欢。因此,他们创建了一个名为Alexa语音服务(Alexa Voice Services)的新部门,目的是为了使Alexa可以很容易地添加到任何类似吊扇,灯泡,冰箱或汽车这类大家一直都在用的产品中。


该部门同时拥有硬件和软件的制造能力。亚马逊AVS技术支持总监Priya Abani说,亚马逊的目标,是想让大家生活在一个Alexa无处不在的世界,“无论你在哪里,或者在跟哪个设备进行语音交互,你都应该可以和Alexa交谈”。


在过去的几年中,“无处不在”这个词已经有了一个全新的含义。由于处理器效率效率提高,带宽可访问能力增强,以及电子产品几十年来难以置信的改进,现在几乎所有东西都可以与互联网连接上。除了汽车、卡车和自行车已经连上了;还包括所有的家用电器,衣服,鞋子和珠宝等。亚马逊公司想要所有的这些连接上互联网的产品都装上Alexa语音助手。


亚马逊的Alexa开发工具包之一,制造商可以购买它来创建自己的语音控制产品


到目前为止,据亚马逊说,在市场上有大约50个不同的Alexa第三方设备,比如Ecobee Thermostat和Anker的Eufy Genie设备。为了将Alexa提升到一个新的水平,并且尽快投入市场中,AVS团队在过去的两年中专注于构建Alexa语音开发系统和工具。


这是一个很大的赌注,因为科技巨头们都想将语言“唤醒”,在语音霸权的争夺中占得先机。为了赢得这场战役,亚马逊集合了一支精英团队。


即插即用


亚马逊想要使语音服务成为一种即插即用的硬件,并尽可能多的添加到不同的设备里面。任何人都应该可以购买套件,开发出产品,下载Alexa软件,并在没有任何预先的知识或亚马逊公司任何的帮助下,成功的运行它。而亚马逊公司事先并不会接触到这些产品。


当Abani在2016年刚加入亚马逊时,她发现大家都在一遍遍的重复,每个人都想为自己的产品添加识别语音的功能,但是没有人知道应该如何做。


“前四个月,我所做的只是和我们的biz-dev团队坐在一起开会,不知道开了有多少次会议。”


有一些恒温器公司,他们只知道温度控制,但不知道如何通过语音来控制。还有一些照明公司,他们知道如何优化LED电灯,但不知道如何建立一个麦克风阵列。


在Abani来到公司之前,亚马逊的团队就开发了所有需要添加的部件,写了简单的文档并打包成了软件,甚至和英特尔这样的芯片制造商合作,把对Alexa的支持植入到了CPU中。


Abani说:“在亚马逊公司完成了所有Echo系统的搭建工作后,我的工作就是了解所有不同产品,并为其添加语音功能,然后重新包装好,推向全世界。”


现在,也就是过了两年,如果你想使用带语言助手Alexa的产品,你可以直接购买。亚马逊公司提供了七种价值数百美金的开发套件,每种套件都对应着一个特定的产品类型。


亚马逊建立的第一个麦克风在一条线上仅有两个麦克风;而新的麦克风产品是有七个麦克风摆放在一个环上,就像Echo的产品一样。


AVS团队的产品经理Al Woo说:“其实这是相同的麦克风阵列,在唤醒的算法和引擎方面使用的是相同的技术。”他展示了一个完全暴露的主板和到处悬挂着电线的小东西,虽然看着是一个半成品,但是他说Alexa已经在上面运行了。


“如果一家公司想要开发一种尽可能与Echo设备的性能和功能相匹配的产品,那么就应该是这样的。”


对于每一个开发工具包,亚马逊公司都会提供关于购买哪个麦克风和处理器的说明。这个套件能帮助开发人员更快速地开始原型设计和测试设备,而无需雇佣一大批语音识别专家或者去测试一千种不同的话筒。


由GE的一个部门制造的Sol灯,它是一个内置Alexa语音助手的智能LED灯


但是现在,语音技术融入这么多产品还为时过早,因此亚马逊公司会倾向于大多数使用AVS服务的产品。这在目前没有问题,而且亚马逊公司也仍在学习如何植入。团队可以与Sonos等合作伙伴合作,找出如何优化Alexa服务的音乐功能,然后将结果提供给所有的合作伙伴。AVS团队也正在努力通过诸如新的Alexa手机配件套件(Alexa Mobile Accessories Kit, AMAK)等产品,将Alexa服务提供给全新的设备。


通过AMAK,耳机和智能手表等蓝牙配件可以通过智能手机连接到Alexa语音助手。也可以在世界各地的个人电脑上使用Alexa服务,与Echo产品拥有相同的宽场语音识别功能。这些所有必要的软件和开发信息都可以在亚马逊的网站上找到。


目前,亚马逊公司还有一个工作,那就是确保Alexa能服务好每一个装载它的设备。因为,即使已经有了所有的这些开发工具包和软件,其他制造商在接上Alexa服务时,仍然需要做很多的调整和适应。


亚马逊的团队很清楚地之道,当人们语音服务体验不佳时,往往不会责怪麦克风布局不好或音频非常糟糕, 他们会责怪Alexa语音助手。因此,亚马逊感觉到,必须确保Alexa在跨设备上的体验。亚马逊公司AVS副总裁皮特·汤普森(Pete Thompson)说:“我们希望确保人们不会去评论Alexa服务的好坏。它只是默默的植入,并工作就行了。”


如何保证Alexa运转?


Alexa的表现是由JR来评价的。JR的意思是Junior Rover,它指的是负责第三方设备测试的一款定制机器人,用它来确保Alexa的服务正确运行。


这是一个小型的呼呼机,有一个橙色底座,四个轮子和一个可以容纳50磅重平台,它可以延伸到6英尺高。在四面的一边,有一台微软的Surface笔记本支撑着这样一台设备运转。Surface的壁纸是一张JR的卡通图片,这种图片上面有着大眼睛、眉毛和类似于2018托马斯坦克引擎的外观。


JR的办公室是一间不带窗户的隔音房间位于亚马逊硬件团队Lab126的办公室里面。这栋平淡无奇的硅谷办公楼里这里既开发着Echo产品,AVS团队又在里面试图将Alexa服务推向世界各地。


当亚马逊即将推出Alexa-enabled的设备时,它会先去桑尼维尔,然后直接进入JR的实验室,对设备如何在别人家中工作,进行的一项广泛而深入的测试。


有人会把它放在实验室的桌子上,然后JR就开始和它聊天。机器人会绕着放在地面上的磁带的磁道一步步的动,并且每次都停在相同的地方。


在每个站的位置上,JR平台上的演讲者都会发出一两个命令:Alexa,牙买加的首都是什么?Alexa,谁写了坎特伯雷的故事?


机器人用22种不同的音调,大声地或轻声地以各种语言和口音说出来。有时候,房间里的一台MacBook会在另一台扬声器上播放一些白噪声,来模拟现实中厨房的声音,看看设备是如何应对的。


每个问题和答案都会被记录下来,并且当测试结束时,亚马逊就会向制造商反馈测试信息。


过去,亚马逊的工作人员需要运行完所有的测试,然后煞费苦心地建立和记录每一个交互结果。因此每个装置需要三天或更长时间才能得到一个适当的测试结果。而JR每天不停的走,每周七天,没有浴室休息或病假,就可以在六小时内完成测试。因此,亚马逊正在努力建造更多像JR一样的机器人和一些新的测试设备。这些新的测试设备是用于车载Alexa以及所有他们甚至还没有想到的设备。


现在,测试实验室的墙上已经悬挂着一些于Alexa相关的产品,一个恒温器,一束奇特的光,一只双腿悬在空中坐着的Lyn 机器人。当你站在这个测试房间里,你会感觉完全被Alexa包围着。


这只是一个开始。亚马逊公司希望能够使Alexa在任何地方都能出色地完成工作,并成为你在生活中最重要,最亲密的计算机。如果,这意味着Alexa正在帮助冰箱制造商与亚马逊自己的Echo产品进行竞争,那也无妨。


只要Alexa在那儿,亚马逊公司就是赢家。


未来智能实验室是人工智能学家与科学院相关机构联合成立的人工智能,互联网和脑科学交叉研究机构。由互联网进化论作者,计算机博士刘锋与中国科学院虚拟经济与数据科学研究中心石勇、刘颖教授创建。


未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)云脑研究计划,构建互联网(城市)云脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

这篇关于语音入口大战升级!亚马逊Alexa放招:即插即用,霸占你所有空间的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/369656

相关文章

你的华为手机升级了吗? 鸿蒙NEXT多连推5.0.123版本变化颇多

《你的华为手机升级了吗?鸿蒙NEXT多连推5.0.123版本变化颇多》现在的手机系统更新可不仅仅是修修补补那么简单了,华为手机的鸿蒙系统最近可是动作频频,给用户们带来了不少惊喜... 为了让用户的使用体验变得很好,华为手机不仅发布了一系列给力的新机,还在操作系统方面进行了疯狂的发力。尤其是近期,不仅鸿蒙O

阿里开源语音识别SenseVoiceWindows环境部署

SenseVoice介绍 SenseVoice 专注于高精度多语言语音识别、情感辨识和音频事件检测多语言识别: 采用超过 40 万小时数据训练,支持超过 50 种语言,识别效果上优于 Whisper 模型。富文本识别:具备优秀的情感识别,能够在测试数据上达到和超过目前最佳情感识别模型的效果。支持声音事件检测能力,支持音乐、掌声、笑声、哭声、咳嗽、喷嚏等多种常见人机交互事件进行检测。高效推

让树莓派智能语音助手实现定时提醒功能

最初的时候是想直接在rasa 的chatbot上实现,因为rasa本身是带有remindschedule模块的。不过经过一番折腾后,忽然发现,chatbot上实现的定时,语音助手不一定会有响应。因为,我目前语音助手的代码设置了长时间无应答会结束对话,这样一来,chatbot定时提醒的触发就不会被语音助手获悉。那怎么让语音助手也具有定时提醒功能呢? 我最后选择的方法是用threading.Time

AI(文生语音)-TTS 技术线路探索学习:从拼接式参数化方法到Tacotron端到端输出

AI(文生语音)-TTS 技术线路探索学习:从拼接式参数化方法到Tacotron端到端输出 在数字化时代,文本到语音(Text-to-Speech, TTS)技术已成为人机交互的关键桥梁,无论是为视障人士提供辅助阅读,还是为智能助手注入声音的灵魂,TTS 技术都扮演着至关重要的角色。从最初的拼接式方法到参数化技术,再到现今的深度学习解决方案,TTS 技术经历了一段长足的进步。这篇文章将带您穿越时

macOS升级后SVN升级

问题 svn: error: The subversion command line tools are no longer provided by Xcode. 解决 sudo chown -R $(whoami) /usr/local/Cellar brew install svn

基于人工智能的智能家居语音控制系统

目录 引言项目背景环境准备 硬件要求软件安装与配置系统设计 系统架构关键技术代码示例 数据预处理模型训练模型预测应用场景结论 1. 引言 随着物联网(IoT)和人工智能技术的发展,智能家居语音控制系统已经成为现代家庭的一部分。通过语音控制设备,用户可以轻松实现对灯光、空调、门锁等家电的控制,提升生活的便捷性和舒适性。本文将介绍如何构建一个基于人工智能的智能家居语音控制系统,包括环境准备

Golang支持平滑升级的HTTP服务

前段时间用Golang在做一个HTTP的接口,因编译型语言的特性,修改了代码需要重新编译可执行文件,关闭正在运行的老程序,并启动新程序。对于访问量较大的面向用户的产品,关闭、重启的过程中势必会出现无法访问的情况,从而影响用户体验。 使用Golang的系统包开发HTTP服务,是无法支持平滑升级(优雅重启)的,本文将探讨如何解决该问题。 一、平滑升级(优雅重启)的一般思路 一般情况下,要实现平滑

【高等代数笔记】线性空间(一到四)

3. 线性空间 令 K n : = { ( a 1 , a 2 , . . . , a n ) ∣ a i ∈ K , i = 1 , 2 , . . . , n } \textbf{K}^{n}:=\{(a_{1},a_{2},...,a_{n})|a_{i}\in\textbf{K},i=1,2,...,n\} Kn:={(a1​,a2​,...,an​)∣ai​∈K,i=1,2,...,n

Collection的所有的方法演示

import java.util.ArrayList;import java.util.Collection;import java.util.Iterator;public class TestCollection {/*** @param args* Collection的所有的方法演示* 此程序没有使用泛型,所以可以添加任意类型* 以后如果写到泛型会补充这一方面的内容*/public s

Temu官方宣导务必将所有的点位材料进行检测-RSL资质检测

关于饰品类产品合规问题宣导: 产品法规RSL要求 RSL测试是根据REACH法规及附录17的要求进行测试。REACH法规是欧洲一项重要的法规,其中包含许多对化学物质进行限制的规定和高度关注物质。 为了确保珠宝首饰的安全性,欧盟REACH法规规定,珠宝首饰上架各大电商平台前必须进行RSLReport(欧盟禁限用化学物质检测报告)资质认证,以确保产品不含对人体有害的化学物质。 RSL-铅,