让车企甘愿“打脸”的纯视觉,机器人玩的转吗?

2024-08-31 05:04

本文主要是介绍让车企甘愿“打脸”的纯视觉,机器人玩的转吗?,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

入坑容易,玩出彩难。

一直以来,关于纯视觉自动驾驶的争议,始终挑拨着业内的神经。不断引发专业人士的“友好讨论”,甚至头部车企的创始人直接下场对线。但正如没有人能准确预知未来一样,在即分高下也决生死的紧张氛围下,总有一方会被回旋镖打到自己。

马斯克的笃定,小鹏的“背刺”

当FSD问题缠身,马斯克却笃定自动驾驶纯视觉就是终极答案,说出融合激光雷达完全毫无意义,注定失败的言论时,已经无需猜测在行业中所能引起的争议有多大。

在2021年,特斯拉突然宣布FSD的V9.0 beta测试版宣布采用纯视觉方案,行业内的质疑声随之再起,但这些声音丝毫没有影响到马斯克的计划,随后便上市了不再配备毫米波雷达的Model 3和Model Y。

正如不管你是天才还是普通人都会栽跟头一样,这次轮到了马斯克,当年11月份便召回了1.1万辆车,重要原因便是纯视觉的表现没有达到预期。一时间,纯视觉不可靠的声音甚至把特斯拉团队搞得“自我怀疑”。

然而时至今日,随着V12版本的发布,纯视觉方案的口碑似乎一夜得到了逆转,其表现出的智驾表现不仅获得了大部分人的认可, 还有融合方案忠实拥趸的“背刺”。

前段时间,何小鹏在美国亲测FSD之后,宣布转向纯视觉。随后业内便曝光了小鹏新车P7+弃用激光雷达。小鹏是国内智能驾驶的领头羊,同时也是融合方案的技术代表,这一突然的转变,不仅引发国内的热议,也让马斯克忍不住评论三点。

事实上,小鹏的转向并非突然,在此之前,业内人士便已曝出激光雷达在去年就没有进入小鹏的BEV网络进行训练,只是在XNet给出感知结果之后,进行识别距离的二次确认。同样,有plan B的不只是小鹏,每家车企都不会固步自守地坚持一个技术路线。诸如华为、蔚来、小米、极越等车企都已在尝试及应用纯视觉方案。因此到今天,当纯视觉逐渐被接受,二者的争议显然已经不再重要。

纯视觉,适合机器人吗?

机器人作为自动驾驶汽车的孪生兄弟,在技术层面有着极大的相似性,均需要通过强大的感知模块获取环境信息,这意味着视觉方案对于机器人有着同样的天然优势。然而优势归优势,虽是孪生子,差异性同样很多。

一方面,视觉方案能获取丰富的环境信息,却也需要消耗极大的计算资源。与汽车搭载的车规级硬件相比,机器人显然做不到。在无论家用机器人还是商用机器人都大打价格战的今天,厂商们无不为了降本增效绞尽脑汁,如果仅是为了应用视觉方案,从而提升整机成本,显然并不现实。

另一方面,自动驾驶面临的真实环境,大多为标准性的,包含标准的交通信号、路面标示、行驶准则等等,而机器人面对的环境相对更加多样,且具有非标性,环境适应能力需要更强。

因此,在保障整体性能的前提下,有效降低算力要求是机器人不同于汽车的第一步。

其次,随着机器人发展趋势回归产品本身,智能化升级成为了核心竞争力。机器人不仅需要具备更稳健的适应能力,还需要具备智能避障、AI识别、人机交互、智能作业、多机协作、智能梯控等等。此外,对于不同领域的机器人,还需要练就独有的“绝活”,如清洁机器人的脏污检测能力。

针对这些需求,视觉方案还需要给出自己的答案。

玩转纯视觉,INDEMIND的答案

作为视觉技术起家的机器人技术公司,从早期的视觉模组产品,到如今的机器人视觉解决方案,INDEMIND一直坚信着视觉技术的潜力。

相较于行业内对于视觉方案的剖析,作为入局者的INDEMIND有着更深刻的体会。面对层出不穷的技术难题,不断投入,敢于创新是保持持续进化的关键。随着核心技术链不断成熟,目前已实现纯视觉方案家用机器人和商用机器人全适配。

在研发过程中,针对算力难题,INDEMIND为此研发了多种轻量化技术,轻量化VSLAM(基于深度学习特征的SLAM架构)、轻量化Depth(基于深度学习特征匹配的Depth)、轻量化深度学习模型(底层算子自研、剪枝、量化),同时还在硬件上,对于视觉处理采用NEON加速、GPU加速、DSP加速等方式,提升计算性能。

目前,在扫地机器人方向,INDEMIND视觉方案搭载4核A53/A55级别芯片即可满足需求,能够适配如RK3566、VicoreTek 6601/6801等(全解决方案情况下,双目视觉多传感器融合SLAM、双目Depth、物体识别及整机完整SDK)。

在环境适应方面,INDEMIND视觉方案可实时自主创建及更新全场景二维地图、三维地图及语义地图,显著提升机器人的场景适应能力。同时,INDEMIND拥有超过100个使用场景的海量数据,对于清洁、配送、导览、安防等多种工作场景有着深度理解,进一步提升机器人的环境自适应能力。

特别需要说到的是,搭载INDEMIND视觉方案的商用机器人可以做到无需预部署,开机即用,这与现有产品有着明显区别。

INDEMIND还开发了一套系统化环境补光策略,包含主动式环境补光配置和光照变化条件下的建图策略,在实际表现中,面对强光直射、无光源、昏暗等特殊光照环境均能无差异工作,满足全天候作业要求。

为了提升智能表现,INDEMIND基于设备端、云端智能决策平台、大数据平台三端,建立了一套智能决策引擎,能够在语义层次上理解环境信息,模仿人类大脑对环境理解的方式,并进行策略处理,实现智能避障、人机交互、智能作业等多种业务逻辑。同时,基于关键数据能够不断更新算法模型,持续提升场景处理和问题应对能力。

值得一提的是,INDEMIND还研发了以视觉图像算法配合融合摄像头及主动补光策略构建而成的脏污识别技术,在实际表现上,目前已能够达到平均脏污检出率99%以上(包含常见固体、液体脏污),支持任何地面材质、花色、光线下的透明、半透明,不透明液体及干涸污渍识别、颗粒状脏污识别、粉末状脏污识别,是目前行业极少成熟且性能优异的技术方案。

新技术的出现,总会面临着争议,但与此同时,我们也需要做好接受新事物的准备。

这篇关于让车企甘愿“打脸”的纯视觉,机器人玩的转吗?的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1122964

相关文章

Python基于火山引擎豆包大模型搭建QQ机器人详细教程(2024年最新)

《Python基于火山引擎豆包大模型搭建QQ机器人详细教程(2024年最新)》:本文主要介绍Python基于火山引擎豆包大模型搭建QQ机器人详细的相关资料,包括开通模型、配置APIKEY鉴权和SD... 目录豆包大模型概述开通模型付费安装 SDK 环境配置 API KEY 鉴权Ark 模型接口Prompt

计算机视觉工程师所需的基本技能

一、编程技能 熟练掌握编程语言 Python:在计算机视觉领域广泛应用,有丰富的库如 OpenCV、TensorFlow、PyTorch 等,方便进行算法实现和模型开发。 C++:运行效率高,适用于对性能要求严格的计算机视觉应用。 数据结构与算法 掌握常见的数据结构(如数组、链表、栈、队列、树、图等)和算法(如排序、搜索、动态规划等),能够优化代码性能,提高算法效率。 二、数学基础

基于树梅派的视频监控机器人Verybot

最近这段时间做了一个基于树梅派 ( raspberry pi ) 的视频监控机器人平台 Verybot ,现在打算把这个机器人的一些图片、视频、设计思路进行公开,并且希望跟大家一起研究相关的各种问题,下面是两张机器人的照片:         图片1:                   图片2                    这个平台的基本组成是:

《计算机视觉工程师养成计划》 ·数字图像处理·数字图像处理特征·概述~

1 定义         从哲学角度看:特征是从事物当中抽象出来用于区别其他类别事物的属性集合,图像特征则是从图像中抽取出来用于区别其他类别图像的属性集合。         从获取方式看:图像特征是通过对图像进行测量或借助算法计算得到的一组表达特性集合的向量。 2 认识         有些特征是视觉直观感受到的自然特征,例如亮度、边缘轮廓、纹理、色彩等。         有些特征需要通

【python计算机视觉编程——7.图像搜索】

python计算机视觉编程——7.图像搜索 7.图像搜索7.1 基于内容的图像检索(CBIR)从文本挖掘中获取灵感——矢量空间模型(BOW表示模型)7.2 视觉单词**思想****特征提取**: 创建词汇7.3 图像索引7.3.1 建立数据库7.3.2 添加图像 7.4 在数据库中搜索图像7.4.1 利用索引获取获选图像7.4.2 用一幅图像进行查询7.4.3 确定对比基准并绘制结果 7.

参会邀请 | 第二届机器视觉、图像处理与影像技术国际会议(MVIPIT 2024)

第二届机器视觉、图像处理与影像技术国际会议(MVIPIT 2024)将于2024年9月13日-15日在中国张家口召开。 MVIPIT 2024聚焦机器视觉、图像处理与影像技术,旨在为专家、学者和研究人员提供一个国际平台,分享研究成果,讨论问题和挑战,探索前沿技术。诚邀高校、科研院所、企业等有关方面的专家学者参加会议。 9月13日(周五):签到日 9月14日(周六):会议日 9月15日(周日

【python计算机视觉编程——8.图像内容分类】

python计算机视觉编程——8.图像内容分类 8.图像内容分类8.1 K邻近分类法(KNN)8.1.1 一个简单的二维示例8.1.2 用稠密SIFT作为图像特征8.1.3 图像分类:手势识别 8.2贝叶斯分类器用PCA降维 8.3 支持向量机8.3.2 再论手势识别 8.4 光学字符识别8.4.2 选取特征8.4.3 多类支持向量机8.4.4 提取单元格并识别字符8.4.5 图像校正

Python计算机视觉编程 第十章

目录 一、OpenCv基础知识 1.读取和写入图像 2.颜色空间 3.显示图像和结果 二、处理视频 1.输入视频 2.将视频读取到NumPy数组中 三、跟踪 1.光流 2.Lucas-Kanade算法 一、OpenCv基础知识 OpenCV 自带读取、写入图像函数以及矩阵操作和数学库。 1.读取和写入图像 import cv2# 读取图像im = c

【机器人工具箱Robotics Toolbox开发笔记(二十)】机器人工具箱SerialLink I类函数参数说明

机器人工具箱中的SerialLink表示串联机器人型机器人的具体类。该类使用D-H参数描述,每个关节一组。SerialLink I类包含的参数如表1所示。 表1 SerialLink I类参数 参  数 意    义 参  数 意    义 plot 显示机器人的图形表示 jacobn 工具坐标系中的雅可比矩阵 plot3D 显示机器人3D图形模型 Jacob_dot

机器视觉硬件选型根据某项目相机镜头

一 项目总需求 1、大视野检测需求: (1)大视野: ①产品尺寸15.6寸屏幕,产品大小:350mm x 225mm; ②产品料盘尺寸大小:565mm x 425mm; ③工作距离:880mm;检测精度:500μm; 1、大视野检测需求: (1)大视野: ①产品尺寸15.6寸屏幕,产品大小:350mm x 225mm; ②产品料盘尺寸大小:565mm x 425mm; 工作距离: