夜晚也清晰可见!ContextualFusion技术突破传统传感器限制,3D对象检测性能显著提升

本文主要是介绍夜晚也清晰可见!ContextualFusion技术突破传统传感器限制,3D对象检测性能显著提升,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

DeepVisionary 每日深度学习前沿科技推送&顶会论文分享,与你一起了解前沿深度学习信息!

在这里插入图片描述

ContextualFusion: Context-Based Multi-Sensor Fusion for 3D Object Detection in Adverse Operating Conditions

引言:自动驾驶车辆在恶劣环境中的挑战

自动驾驶车辆(AV)设计目的是在几乎不需要人类干预的情况下,在真实世界的场景中自行驾驶。这些车辆通常配备有多种传感器,包括摄像头、激光雷达、雷达、超声波传感器、GPS和IMU。由于自动驾驶技术有望使交通更安全,因此这一领域的研究非常受欢迎。例如Waymo和GM Cruise等公司已经开始在限定区域部署自动驾驶出租车队,主要是在天气良好的条件下。然而,自动驾驶系统要实现这一目标,必须可靠地感知其运行环境。全自动AV必须能够在水平视场360度范围内、垂直视场±15-20度范围内看到,没有任何盲点。

在本文中,我们专注于在恶劣条件下融合摄像头图像和激光雷达点云。摄像头提供丰富的像素级信息,但可能会被直射阳光照射而失效,并且在夜间和低光照条件下性能显著下降。激光雷达作为主动传感器提供3D信息,在白天和夜间条件下均能良好工作。然而,激光雷达的光束也可能被大雨和雾散射,导致物体检测出现误报。最近的研究表明,使用多模态深度学习模型融合传感器数据通常能有效提高感知性能。

在这里插入图片描述

论文标题、机构、论文链接和项目地址

论文标题: ContextualFusion: Context-Based Multi-Sensor Fusion for 3D Object Detection in Adverse Operating Conditions

机构: Shounak Sural1, Nishad Sahu1 and Ragunathan (Raj) Rajkumar1

论文链接: ContextualFusion Paper

项目地址: GitHub - ContextualFusion
在这里插入图片描述

研究背景与动机

自动驾驶汽车(AV)旨在在现实世界场景中实现无人驾驶,几乎不需要人类参与。这些AV通常配备有多种传感器,包括摄像头、激光雷达、雷达、超声波传感器、GPS和IMU。由于自动驾驶技术有望使交通更安全,因此该领域的研究受到了广泛关注。例如,Waymo和GM Cruise等公司已开始在限定区域部署自动驾驶出租车车队,主要在天气良好的条件下。然而,大多数交通事故都是由人为错误引起的,从驾驶过程中移除人类或减少人类参与,有可能避免或最小化大量的交通事故。为了实现这一目标,自动驾驶系统必须可靠地感知其运行环境。全自动AV必须能够在水平视野360度、垂直视野±15-20度范围内无盲区地观察周围环境。摄像头、激光雷达和雷达传感器的组合为实现这一目标提供了重要的冗余性。然而,现有的许多感知方法在夜间和雨天等恶劣条件下的性能会大幅下降,这对于真实世界的部署是一个重大挑战。
在这里插入图片描述

ContextualFusion模型介绍

1. 模型概述

ContextualFusion是一个多传感器融合模型,专为在恶劣操作条件下进行3D对象检测而设计。该模型利用环境上下文信息,通过智能地分配激光雷达和摄像头模态在不同光照和雨天条件下的重要性,显著提高感知性能。例如,在夜间或低光照条件下,ContextualFusion能够准确地检测到激光雷达和摄像头视图中都可见的车辆,而现有的一些基于摄像头的方法则无法做到。

2. 3D对象检测

ContextualFusion采用鸟瞰图(BEV)空间进行3D对象检测,这种方式在保持几何信息的同时,有效地利用了摄像头和激光雷达的数据。模型中,摄像头特征提取块使用SwinTransformer,而激光雷达特征提取块则采用VoxelNet架构。通过这种设置,可以在BEV空间中将摄像头和激光雷达特征进行有效融合。

3. 门控卷积融合

在ContextualFusion模型中,一个关键的创新是门控卷积融合(Gated Convolutional Fusion)。这一技术根据环境上下文(如夜间或雨天条件)动态调整激光雷达和摄像头数据的权重,优化融合过程。通过这种方式,模型能够在不同的环境条件下,更有效地处理和融合来自不同传感器的数据,从而提高了对象检测的准确性和可靠性。

总之,ContextualFusion通过利用环境上下文信息和先进的融合技术,显著提高了在恶劣条件下的3D对象检测性能,为自动驾驶汽车在复杂环境中的安全运行提供了强有力的技术支持。
在这里插入图片描述

实验设计与数据集

1. 数据集使用

在本研究中,我们使用了两个主要的数据集:真实世界的NuScenes数据集和我们自己生成的合成多模态数据集AdverseOp3D。NuScenes数据集包含了使用车辆记录的各种传感器数据,包括360度高分辨率的激光雷达和六个摄像头。该数据集有大约1000个场景,每个场景大约有40个标注帧,总共约40,000个数据样本。AdverseOp3D数据集是在CARLA模拟器中生成的,模拟了不利的天气条件,如夜间和雨天,以补充NuScenes数据集在这些条件下的数据不足。

2. 合成多模态数据集的创建

我们使用CARLA模拟器生成了名为AdverseOp3D的合成数据集。在模拟器中,我们安装了与NuScenes数据集生成过程中描述的相同位置和方向的六个摄像头和一个激光雷达。我们在模拟环境中生成了地面真实的边界框注释列表,并确保只使用与至少一个激光雷达点相交的边界框的相关子集。此外,我们还存储了关于白天或夜间条件以及是否有雨的环境信息,这些信息作为地面真实数据直接可用。
在这里插入图片描述

实验结果与分析

1. 性能评估

我们使用平均精度(AP)分数来评估各个感兴趣类别的3D对象检测性能,以及使用所有类别的平均AP(mAP)来获得整体性能估计。我们的ContextualFusion模型在NuScenes数据集的夜间和雨天子集上表现出色,尤其是在夜间条件下,与BEVFusion方法相比,我们的方法在总体mAP上提高了11.7%。

2. 独立与约束融合方法的比较

我们探索了在融合模块中根据环境上下文独立或统一调整激光雷达和摄像头特征权重的两种方法。结果显示,独立变化权重的方法(ContextualFusion (Independent))在不同环境条件下提供了更好的性能,特别是在夜间和雨天条件下。
在这里插入图片描述

3. AdverseOp3D数据集的实验结果

在我们平衡的AdverseOp3D数据集上,ContextualFusion方法的整体mAP达到了60.0%,在所有四个感兴趣的类别(汽车、卡车、公交车和行人)中都取得了最佳的个别AP。这一结果证明了我们的数据生成方法的实用性,并强调了在各种环境条件下测试和评估3D对象检测模型的重要性。

通过这些实验,我们证明了ContextualFusion模型在处理不利天气和光照条件下的3D对象检测任务方面的有效性和优越性。

模型的优势与实际应用

1. 模型优势

ContextualFusion模型通过融合摄像头图像和激光雷达点云数据,在不利的环境条件下显著提高了感知性能。这种基于环境上下文的融合方法能够在夜间或雨天等复杂环境中,有效地提高目标检测的准确性。例如,在NuScenes数据集的夜间测试中,ContextualFusion模型相比于传统的BEVFusion模型,在总体平均精度(mAP)上提高了11.7%。

此外,ContextualFusion模型利用Gated Convolutional Fusion技术,根据环境条件(如白天或夜晚,晴天或雨天)动态调整摄像头和激光雷达数据的相对重要性。这种方法不仅提高了模型的适应性,还优化了在复杂环境中的性能。

2. 实际应用

ContextualFusion模型的实际应用主要体现在自动驾驶领域,尤其是在恶劣天气和照明条件下的车辆感知系统。通过在CARLA模拟器中生成的AdverseOp3D数据集进行训练和测试,该模型已经证明可以有效地识别和定位在夜间或雨天条件下的各种车辆和行人。这一能力对于提高自动驾驶车辆在复杂环境中的安全性和可靠性至关重要。
在这里插入图片描述

未来研究方向

1. 增强数据集的真实性

未来的研究可以集中在进一步增强模拟数据集的真实性。尽管AdverseOp3D数据集已经包含了多种不利条件,但其在视觉效果上与真实世界数据仍存在差距。通过引入更高级的风格迁移技术,可以使模拟数据更加贴近真实世界的分布,从而提高模型在实际应用中的泛化能力和准确性。

2. 开发上下文感知框架

另一个重要的研究方向是开发更加高效的上下文感知框架。这包括利用深度学习技术来识别和预测环境条件,如天气变化和光照条件,以及这些条件如何影响感知和定位系统的性能。通过整合这些上下文信息,可以进一步优化多传感器融合策略,实现更为精确和可靠的目标检测。

3. 探索新的传感器融合方法

未来的研究还可以探索新的传感器融合方法,以提高在极端环境条件下的检测性能。例如,研究如何有效融合来自不同类型传感器的数据,包括红外摄像头、毫米波雷达等,可能会开辟新的途径来进一步提升自动驾驶系统在多变环境中的适应性和准确性。
在这里插入图片描述

总结

本文提出了一种名为ContextualFusion的多传感器融合方法,旨在改善自动驾驶车辆在夜间和恶劣天气条件下的3D对象检测性能。通过智能地调整相机和激光雷达数据的相对重要性,ContextualFusion能够根据白天或夜间条件以及是否下雨来优化数据融合过程。

我们开发了一个名为AdverseOp3D的合成数据集,该数据集包含了各种恶劣天气条件下的场景,以此来对抗现有数据集中晴朗天气条件的偏见。在真实世界的NuScenes数据集上,ContextualFusion在夜间条件下的表现优于现有的最佳方法,显示出11.7%的mAP提升。此外,ContextualFusion在整个AdverseOp3D数据集上也显示出比现有网络高6.2%的mAP提升。

通过引入基于环境上下文的门控卷积融合(Gated Convolutional Fusion),我们的方法能够在不同的传感器和环境条件下动态调整数据融合策略,从而提高了模型的泛化能力和实用性。此外,我们的模型在单个A6000 GPU上的推理速度与BEVFusion相当,进一步证明了其在实际应用中的可行性。

未来的研究将继续探索上下文检测框架的开发,并利用上下文感知方法来改善自动驾驶车辆在所有操作环境下的感知和定位能力。同时,我们计划进一步增强AdverseOp3D数据集的真实感,以更好地反映现实世界的分布,为自动驾驶技术的发展提供更坚实的数据支持。

关注DeepVisionary 了解更多深度学习前沿科技信息&顶会论文分享!

这篇关于夜晚也清晰可见!ContextualFusion技术突破传统传感器限制,3D对象检测性能显著提升的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/973011

相关文章

C++对象布局及多态实现探索之内存布局(整理的很多链接)

本文通过观察对象的内存布局,跟踪函数调用的汇编代码。分析了C++对象内存的布局情况,虚函数的执行方式,以及虚继承,等等 文章链接:http://dev.yesky.com/254/2191254.shtml      论C/C++函数间动态内存的传递 (2005-07-30)   当你涉及到C/C++的核心编程的时候,你会无止境地与内存管理打交道。 文章链接:http://dev.yesky

如何突破底层思维方式的牢笼

我始终认为,牛人和普通人的根本区别在于思维方式的不同,而非知识多少、阅历多少。 在这个世界上总有一帮神一样的人物存在。就像读到的那句话:“人类就像是一条历史长河中的鱼,只有某几条鱼跳出河面,看到世界的法则,但是却无法改变,当那几条鱼中有跳上岸,进化了,改变河道流向,那样才能改变法则。”  最近一段时间一直在不断寻在内心的东西,同时也在不断的去反省和否定自己的一些思维模式,尝试重

轻量级在线服装3D定制引擎Myway简介

我写的面向web元宇宙轻量级系列引擎中的另外一个,在线3D定制引擎Myway 3D。 用于在线商品定制,比如个性化服装的定制、日常用品(如杯子)、家装(被套)等物品的在线定制。 特性列表: 可更换衣服款式,按需定制更换模型可实时更改材质颜色可实时添加文本,并可实时修改大小、颜色和角度,支持自定义字体可实时添加艺术图标,并可实时修改大小、颜色和角度,支持翻转、各种对齐可更改衣服图案,按需求定制

乐鑫 Matter 技术体验日|快速落地 Matter 产品,引领智能家居生态新发展

随着 Matter 协议的推广和普及,智能家居行业正迎来新的发展机遇,众多厂商纷纷投身于 Matter 产品的研发与验证。然而,开发者普遍面临技术门槛高、认证流程繁琐、生产管理复杂等诸多挑战。  乐鑫信息科技 (688018.SH) 凭借深厚的研发实力与行业洞察力,推出了全面的 Matter 解决方案,包含基于乐鑫 SoC 的 Matter 硬件平台、基于开源 ESP-Matter SDK 的一

一份LLM资源清单围观技术大佬的日常;手把手教你在美国搭建「百万卡」AI数据中心;为啥大模型做不好简单的数学计算? | ShowMeAI日报

👀日报&周刊合集 | 🎡ShowMeAI官网 | 🧡 点赞关注评论拜托啦! 1. 为啥大模型做不好简单的数学计算?从大模型高考数学成绩不及格说起 司南评测体系 OpenCompass 选取 7 个大模型 (6 个开源模型+ GPT-4o),组织参与了 2024 年高考「新课标I卷」的语文、数学、英语考试,然后由经验丰富的判卷老师评判得分。 结果如上图所

持久层 技术选型如何决策?JPA,Hibernate,ibatis(mybatis)

转自:http://t.51jdy.cn/thread-259-1-1.html 持久层 是一个项目 后台 最重要的部分。他直接 决定了 数据读写的性能,业务编写的复杂度,数据结构(对象结构)等问题。 因此 架构师在考虑 使用那个持久层框架的时候 要考虑清楚。 选择的 标准: 1,项目的场景。 2,团队的技能掌握情况。 3,开发周期(开发效率)。 传统的 业务系统,通常业

亮相WOT全球技术创新大会,揭秘火山引擎边缘容器技术在泛CDN场景的应用与实践

2024年6月21日-22日,51CTO“WOT全球技术创新大会2024”在北京举办。火山引擎边缘计算架构师李志明受邀参与,以“边缘容器技术在泛CDN场景的应用和实践”为主题,与多位行业资深专家,共同探讨泛CDN行业技术架构以及云原生与边缘计算的发展和展望。 火山引擎边缘计算架构师李志明表示:为更好地解决传统泛CDN类业务运行中的问题,火山引擎边缘容器团队参考行业做法,结合实践经验,打造火山

雨量传感器的分类和选型建议

物理原理分类 机械降雨量计(雨量桶):最早使用的降雨量传感器,通过漏斗收集雨水并记录。主要用于长期降雨统计,故障率较低。电容式降雨量传感器:基于两个电极之间的电容变化来计算降雨量。当降雨时,水滴堵住电极空间,改变电容值,从而计算降雨量。超声波式降雨量传感器:利用超声波的反射来计算降雨量。适用于大降雨量的场合。激光雷达式降雨量传感器:利用激光技术测量雨滴的速度、大小和形状等参数,并计算降雨量。主

API-环境对象

学习目标: 掌握环境对象 学习内容: 环境对象作用 环境对象: 指的是函数内部特殊的变量this,它代表着当前函数运行时所处的环境。 作用: 弄清楚this的指向,可以让我们代码更简洁。 函数的调用方式不同,this指代的对象也不同。【谁调用,this就是谁】是判断this指向的粗略规则。直接调用函数,其实相当于是window.函数,所以this指代window。

基于CTPN(tensorflow)+CRNN(pytorch)+CTC的不定长文本检测和识别

转发来源:https://swift.ctolib.com/ooooverflow-chinese-ocr.html chinese-ocr 基于CTPN(tensorflow)+CRNN(pytorch)+CTC的不定长文本检测和识别 环境部署 sh setup.sh 使用环境: python 3.6 + tensorflow 1.10 +pytorch 0.4.1 注:CPU环境