Rokid创始人祝铭明:元宇宙的本质、底层和核心技术 | MEET2022

本文主要是介绍Rokid创始人祝铭明:元宇宙的本质、底层和核心技术 | MEET2022,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

编辑部 整理自 MEET 2022
量子位 报道 | 公众号 QbitAI

回望2021年的科技圈,最绕不开的关键词非“元宇宙”莫属。

今天,当人们反复谈及这个新兴概念时,总是会忍不住大谈畅想和未来,幻想这个虚拟世界会有怎样的新功能。

但在MEET 2022智能未来大会现场,Rokid创始人及CEO祝铭明却给出了不一样的思考:

我们想关注更本质、底层的技术。

在元宇宙爆火的背景下,这一观点显得冷静又克制。

而作为一家从2014年就入场AR领域、专注人机交互的科技公司,Rokid从产业角度出发已经有了多年的经验与思考。

为了完整体现祝铭明有关AR智能眼镜落地探索的思考,在不改变原意的基础上,量子位对他的演讲内容进行了编辑整理。希望也能给你带来新的启发。

关于MEET 智能未来大会:MEET大会是由量子位主办的智能科技领域顶级商业峰会,致力于探讨前沿科技技术的落地与行业应用。MEET2022采取线上参会形式,20余家直播平台和渠道转播大会直播,200万行业用户线上参会。除量子位微信、头条号、知乎、微博等全媒体矩阵外,新华社、凤凰科技、腾讯科技、澎湃新闻等数十家主流媒体纷纷报道大会及相关内容,线上曝光量累计超过2000万。

演讲要点

  • 谈Metaverse,便要关注感知、理解、协同、展现、数字资产5个方面。

  • 元宇宙还是一条非常漫长的路,Rokid想从核心能力出发,一步步带领大家走向那个终点。

  • 从使用场景和功能属性两个维度出发,AR眼镜可被划分为4个种类。

  • Rokid不认为现在可以用一个通用产品来覆盖所有场景,因此需要对每种产品进行专门地打磨。

  • 硬件、技术之外,Rokid还打造了自己的OS,并开放给更多开发者用。

关注元宇宙更本质、底层的东西

Rokid从成立第一天起,我们对自己就有一个明确的定位:

我们更关注的是如何将真实世界与虚拟世界融合。

由此,我们把开发的重点放在了AI和AR上,在VR方面不做过多探索。今天,大家谈元宇宙都很喜欢畅想未来,但是Rokid想关注一些更本质、更底层的东西。

对此,我总结了5个方面。

第一,是感知能力。这会偏向于麦克风、照相机等传感器方面的技术。

第二,是理解能力。AI的范畴非常广,Rokid更关注AI在感知的基础上如何理解这个世界,通过周边的环境理解人与事。

第三,是协同能力。实现人机交互,首先要对人与人之间、人与事物之间的协同深度思考。

比如Facebook推出的VR远程办公应用、我们这次线上直播会议,也都是某种协同。

Rokid也在这个领域里面,有一些自己的思考。我们认为协同不仅是在虚拟世界中进行,更是真实世界与数字世界的融合。

第四,是展现能力。

现在大家谈论AR、VR、MR,更多关注的还是容易吸引眼球的东西。

这就体现了展现能力,其背后是基于光学、图形引擎、空间引擎和算法等方面技术。

最后还有一个方面不得不重视,是数字资产

这其中包括创作工具、生产工具、管理及安全等方面的能力。

以上这个5个方面,Rokid会有自己的思考,但也不会自己单打独斗做所有的内容。

7be857565f7dc1787708d1d1795faeb9.png

我们会和整个产业界合作,最终将这5个能力融合到自己的操作系统中,为大家提供对应的硬件产品和开放平台。

为什么Rokid更关注底层能力架构?

因为探索Metaverse是一条非常漫长的路,会延续5年、10年、20年甚至更久。作为一个实业类的公司,我们和其他研究型团队或者机构不大一样,我们会更加关注一些核心能力和整个路线该怎么走。

Rokid想做的是一步一步带大家到那个地方去。

四个象限划分AR眼镜

而从一家产品平台型公司的角度出发,我们还会考虑技术的载体。

除了前面提到的5个能力,针对终端设备,我们也有4方面的思考。

8bef69d4ef5aae704530537a119ed7f1.png

横轴从使用场景出发,纵轴从功能属性出发,我们将AR眼镜大致分为四个象限

首先看第四象限,偏工具属性、强调日常长时间佩戴。

其中这款产品叫做Rokid Glass,现在已经升级到了第二代Rokid Glass 2.

2019年我们就发布了这个产品,已经在全球范围内有了应用和落地。

就在今早我们刚刚得知消息,代表全球最精密生产线的瑞士手表,也将我们列为了它的生产合作伙伴,并且在主页上有长篇介绍。

再看第三象限,这部分希望AR眼镜可以用在专业领域、更强调计算能力。

其中这款产品叫做X-Craft,它强调展现计算能力,带有GPS、GPU、NPU等大量计算单元。

它也是一款在全球范围内销售的产品,国内许多能源制造企业中都已经有了应用。

621fa73bef049aa12e718600482da040.png

而在第二象限,我们也在考虑如何让AR眼镜逼近每一个人的日常生活,

所以今年我们上线了一款名为Rokid Air的产品。

它虽然还不能做到像普通眼镜那般容易佩戴,但也已非常轻便,放在口袋里毫无压力的那种。

ab2231d21f6feb16b7e817b5dfc0650b.gif

同时它的能力也更偏向内容交互。

今天我们谈论Metaverse,很多人可能是受到这一象限产品的影响。

目前在一些众筹网站上已经有人抢先体验到了这款产品,反响很不错;所以我们最近也在筹备大规模销售,今年年底它或许就会和大家见面。

9021564f5858ca85fda00437c042767b.gif

当然我们也不会放弃继续探索可每天日常佩戴的场景。

在第一象限内,我们一直保持的产品研究方向叫Rokid Vision,目标是希望它能像普通佩戴眼镜一样方便,而不仅仅只是用在一些特定场合。

以上就是我们对整个AR产品的布局、衡量和定位。

覆盖智能制造、文旅、娱乐等领域

其实德国很多汽车厂都在使用Rokid Glass系列产品,如奥迪、宝马、奔驰、保时捷等等。

尤其在疫情期间,Rokid的产品非常受欢迎,直到今天仍然畅销。

134b0b315cabc680c40697834fd1db33.png

与此同时,我们还将AR眼镜和疫情防控结合在一起,其优势更多体现在人性关怀。

当测温人员佩戴AR眼镜后,在几米远的位置就能识别到每个人的体温,由此便无需将人拦下来,通过测温门或者体温枪指着人的方式来测温。

这其中用到了大量的AI技术,可以保障很高的精确度、稳定度,还能同时识别多人体温。

这个产品目前在全球有70多个国家和地区使用。

6c72262d97537cd4864709209f4d4e54.png

智能制造业方面,美的、比亚迪等国内灯塔工厂都在使用我们的产品。

如下展示的,就是在生产线上使用Rokid Glass2的场景。其核心在于如何让使用者不用编写代码、就能完成对自己整个工作流程的设定。

13990156784b1ebad0a4dcc911edbf21.png

我们将AI能力与无代码、低代码配置平台结合,让更多人能够快速将我们的产品用在不同生成领域,这也是行业里比较领先的做法。

事实上,当我们谈论AR或Metaverse时,硬件只是其中之一,更重要的是后台算力等方面的能力。

在此,我给大家举一个例子。

在中石油AR智能辅助系统中,X-Craft更强调安全性,它配有北斗和GPS,同时也防尘防爆防污染,是一个专门针对重工业领域的产品。

而这个系统与国家电网的AR巡检/运维系统,在产品形态上有所不同,但基本平台是互通的。

这其实就是Rokid根据场景对产品的定制和细分。

但在此也分享一个我们的观点:Rokid不认为现在可以用一个通用产品来覆盖所有场景。

如果想要在行业里落地,我们都是会针对每一行业的特性对产品进行打磨。

而除了工业上的应用,我们还希望Rokid能够走到消费类市场。

比如Rokid Air,它最早被使用在文旅场景里。国内很多景点都在用Rokid Air进行文物或景区解说、导览、甚至一些古建筑重现。

大家知道现存的很多古建筑遗址,无法重现往日的辉煌,但是我们通过AR技术可以将它们重现。

aa40ad8228310b4d4e4111e215e080f8.png

目前我们也在如火如荼地推进这块业务,已经成立了团队专门建设生态体系,同时我们还引进很多伙伴帮忙进行内容创作、线下服务和推广。

我相信AR技术在文博领域会对传统导游解说、机器解说、二维码讲解带来一次全新的变革。

这里要强调一个概念,Rokid做人机交互是由不同阶段的。

从最早的指令型人机交互,再到图形化人机交互,显然是对人越来越友好的。

我们认为下一代人机交互会和AI息息相关,我们将它定位为基于专注力和意图的人机交互。

文博领域,我们就是在打造这样的能力。

举例来说,如果使用Rokid的AR眼镜,在逛博物馆时无需做任何指令,不需要任何点击、操作,只要盯着界面就可以操控。

这样的AR眼镜自身可以去理解周围环境,能掌握使用者的注意力在哪里,最后还能推荐信息。

整体的操作会非常简单,不管是老人孩子,甚至是不会使用手机的人,戴上这样的AR眼镜走进博物馆,都能有非常好的体验。

91a40d14a81c1b9d14af444e952b141e.png

再给大家分享一个产品,就是我们对消费级AR眼镜的尝试——Rokid Air

它更侧重于让每一个人都能体验到AR。

在此当然娱乐先行,比如更加高清的视频体验、娱乐游戏互动,它不仅仅是更大屏幕,而是从交互上给大家展现更多不一样的内容。

ad4ef9b2f4c0878b3073707b71fad03d.gif

Rokid认为,如果元宇宙是一个发展方向,那元宇宙不应该局限于虚拟世界、不应该与真实世界割裂,它应该是考虑如何将人与真实世界、虚拟世界进行融合。

所以我们会不遗余力地在AR领域探索,让我们的产品成为大家进入元宇宙的一个入口或桥梁。

开放Rokid的系统给大家用

最后再和大家介绍一下Rokid的系统。

我自己、我们团队中,很多人都有做AR研发的背景,在这个领域里大家可以看到,Rokid一直致力于建立自己的系统。

很多人或许会问,在Metaverse中系统和过去的OS、基础平台会有怎样的区别?

在此我和大家分享一些Rokid的思考:

我们认为有3个核心区别。

第一,当然是从2D到3D的变化。而且这个3D还不是传统意义上的3D屏幕,而是一个空间的概念。

第二,是在界面、输入方面的变化。原来我们通过键盘、鼠标来操作系统,未来则可能通过你的眼睛、语言、意图、姿态、大脑或者更多方式,这个将会非常有趣。

简单讲,就是从指令式交互变成注意力或意图交互

第三,是将真实世界和虚拟世界融合的变化。这是大势所趋,也是Rokid在构建自己的系统时,一个非常重要的理念。

14dc00e88a66dde6bab3f23a0db47d7e.png

大家可以看到,我们将传统的OS系统作为底层,向上来构建能力。

这样一来,开发者就不用关心AI、不用关心AR,也不用关心数字引擎、空间引擎等,只需要去做内容开发和相关应用就好,

这一系统我们也会对外开放,目前已经有超过200个专业开发者在使用Rokid的OS。

如果大家之后拥有了我们的产品,就能在上面看到非常多精彩的游戏和应用。

但是Rokid本身并不认为,Metaverse很快会发展到每个人都能用的阶段,不会有那么快

不过Rokid还是会耐着心一步一步打造我们的基本能力、平台、产品,帮助大家一步一步走到未来的那个世界。

最后,和大家分享一下Rokid的口号:Leave Noboby Behind

我们希望将来科技和人文可以融合,让越来越多人都能够使用我们的产品、让科技为他们服务,真正做到每个人、每天都会使用未来新技术。

(最后,如果想回看大会全程,请点击阅读原文)

这篇关于Rokid创始人祝铭明:元宇宙的本质、底层和核心技术 | MEET2022的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/203774

相关文章

【编程底层思考】垃圾收集机制,GC算法,垃圾收集器类型概述

Java的垃圾收集(Garbage Collection,GC)机制是Java语言的一大特色,它负责自动管理内存的回收,释放不再使用的对象所占用的内存。以下是对Java垃圾收集机制的详细介绍: 一、垃圾收集机制概述: 对象存活判断:垃圾收集器定期检查堆内存中的对象,判断哪些对象是“垃圾”,即不再被任何引用链直接或间接引用的对象。内存回收:将判断为垃圾的对象占用的内存进行回收,以便重新使用。

哈希表的底层实现(1)---C++版

目录 哈希表的基本原理 哈希表的优点 哈希表的缺点 应用场景 闭散列法 开散列法 开放定值法Open Addressing——线性探测的模拟实现 超大重点部分评析 链地址法Separate Chaining——哈希桶的模拟实现 哈希表(Hash Table)是一种数据结构,它通过将键(Key)映射到值(Value)的方式来实现快速的数据存储与查找。哈希表的核心概念是哈希

TL-Tomcat中长连接的底层源码原理实现

长连接:浏览器告诉tomcat不要将请求关掉。  如果不是长连接,tomcat响应后会告诉浏览器把这个连接关掉。    tomcat中有一个缓冲区  如果发送大批量数据后 又不处理  那么会堆积缓冲区 后面的请求会越来越慢。

嵌入式技术的核心技术有哪些?请详细列举并解释每项技术的主要功能和应用场景。

嵌入式技术的核心技术包括处理器技术、IC技术和设计/验证技术。 1. 处理器技术    通用处理器:这类处理器适用于不同类型的应用,其主要特征是存储程序和通用的数据路径,使其能够处理各种计算任务。例如,在智能家居中,通用处理器可以用于控制和管理家庭设备,如灯光、空调和安全系统。    单用途处理器:这些处理器执行特定程序,如JPEG编解码器,专门用于视频信息的压缩或解压。在数字相机中,单用途

Linux 云计算底层技术之一文读懂 Qemu 架构

Qemu 架构概览 Qemu 是纯软件实现的虚拟化模拟器,几乎可以模拟任何硬件设备,我们最熟悉的就是能够模拟一台能够独立运行操作系统的虚拟机,虚拟机认为自己和硬件打交道,但其实是和 Qemu 模拟出来的硬件打交道,Qemu 将这些指令转译给真正的硬件。 正因为 Qemu 是纯软件实现的,所有的指令都要经 Qemu 过一手,性能非常低,所以,在生产环境中,大多数的做法都是配合 KVM 来完成

【编程底层原理】方法区、永久代和元空间之间的关系

Java虚拟机(JVM)中的内存布局经历了几个版本的变更,其中方法区、永久代和元空间是这些变更中的关键概念。以下是它们之间的关系: 一、方法区: 1、方法区是JVM规范中定义的一个概念,它用于存储类信息、常量、静态变量、即时编译器编译后的代码等数据。 3、它是JVM运行时数据区的一部分,与堆内存一样,是所有线程共享的内存区域。 二、永久代(PermGen): 1、在Java SE 7之前,

ElasticSearch底层原理简析

1.ElasticSearch简述 ElastiaSearch(以下简称ES)是一个基于Lucene的搜索服务器,它提供了一个分布式多用户能力的全文搜索引擎,支持RESTful web接口。Elasticsearch是用Java开发的,并作为Apache许可条款下的开放源码发布,是当前流行的企业级搜索引擎。ES设计用于云计算中,能够进行实时搜索,支持PB级搜索,具有稳定,可靠,快速,安装使用方便等

【编程底层思考】详解Java的JUC多线程并发编程底层组件AQS的作用及原理

Java中的AbstractQueuedSynchronizer(简称AQS)是位于java.util.concurrent.locks包中的一个核心组件,用于构建锁和其他同步器。AQS为实现依赖于FIFO(先进先出)等待队列的阻塞锁和相关同步器提供了一套高效、可扩展的框架。 一、AQS的作用 统一同步状态管理:AQS提供了一个int类型的成员变量state,用于表示同步状态。子类可以根据自己

了解elementUI的底层源码, 进行二次开发

Element UI 是一个基于 Vue.js 的桌面端组件库,广泛用于构建美观、交互友好的用户界面。要深入理解 Element UI 的底层源码并进行二次开发,你需要掌握以下几个关键点: Vue.js 原理 Element UI 是基于 Vue.js 构建的,因此首先需要熟悉 Vue.js 的核心概念和机制,包括: ● 组件系统:Vue.js 的组件化思想,如何定义组件、使用组件、传递属性和事

Anthropic 创始人 Dario Amodei 谈:关于护城河与风险,AI 大很难直接替代人

护城河的迷思   近期,Anthropic创始人Dario Amodei与投资人Erik Torenberg进行了一场引人关注的对话。他们探讨了AI的护城河与潜在风险。话说,护城河就像酒水的保质期,过了时间就得小心别翻车。Amodei提到,AI虽有强大的潜力,但短期内难以完全替代人类的智慧。这可让很多人松了一口气,毕竟机器发热总比人心复杂,听着都觉得不舒服。 聪明与控制的博弈   Dar