#每天一篇论文 Monocular 3D Object Detection with Pseudo-LiDAR Point Cloud

本文主要是介绍#每天一篇论文 Monocular 3D Object Detection with Pseudo-LiDAR Point Cloud,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

Monocular 3D Object Detection with Pseudo-LiDAR Point Cloud
单目伪激光雷达点云3D目标检测
摘要

单目3D场景理解任务,例如目标大小估计,车头角度估计和3D位置估计,非常具有挑战性。当前成功的三维场景理解方法需要使用三维传感器。另一方面,基于单一图像的方法性能明显较差。在这项工作中,我们的目标是通过增强基于激光雷达的算法来处理单个图像输入,从而弥合3D传感和2D传感在3D目标检测方面的性能差距。具体来说,我们进行单目深度估计,并将输入图像提升到点云表示,我们称之为伪激光雷达点云。然后我们可以用我们的伪激光雷达端到端训练一个基于激光雷达的三维检测网络。按照两阶段3D检测算法的流程,我们在输入图像中检测2D目标建议,并从伪激光雷达中为每个建议提取一个点云截锥。然后为每个截锥检测一个定向的三维边界框。为了处理大量噪音伪激光雷达,我们提出了两个创新点:(1)使用二维-三维包围盒一致性约束,调整预测的三维包围盒,使其投影到图像上后与其对应的二维方案有较高的重叠度;(2)使用实例遮罩代替包围盒作为二维方案的表示,以减少点云视景中不属于对象的点的数量。通过对KITTI基准的评估,我们在所有单目视觉方法中,鸟瞰和3D目标检测方面都取得了一流的性能,有效地将性能提高了四倍于以前的最先进水平。

贡献

(1)提出了一种单目三维目标检测流水线,增强了基于激光雷达的单目图像检测方法;
(2)通过实验证明了该框架的瓶颈在于单目深度估计不准确导致的伪激光雷达噪声;
(3)提出在训练过程中使用包围盒一致性损失和在测试过程中使用一致性优化来调整三维包围盒预测;
(4)证明了使用实例掩码作为二维检测方案表示的优点;
(5)在标准的三维目标检测基准上,我们实现了最先进的性能,并且比所有的单目方法都有了前所未有的改进。

方法

目标是仅从一个RGB图像估计对象的定向3D边界框
在这里插入图片描述

1.深度估计

本文采用单目深度估计DORN算法

2.深度图–点云图生成

在这里插入图片描述
(cx, cy) 像素中心. fx and fy are the focal length of the camera along x and y axes

3.伪激光雷达和激光雷达区别

伪激光雷达与激光雷达点云的区别在于点云的密度。虽然高成本的激光雷达可以提供高分辨率的点云,但激光雷达点的数量仍然比伪激光雷达点云少至少一个数量级。

2D实例Mask检测

为了为每个对象生成一个点云截面,我们首先在2D中检测一个对象建议。
在这里插入图片描述

Amodel 3D目标检测

基于生成的伪激光雷达和二维实例Mask,可以提取一组点云截头体,然后通过这些截面体训练出一种基于两级激光雷达的三维边界检测算法。

2D - 3D 边界盒关联

为了缓解局部失准问题,本文作者使用边界盒一致性的几何约束来改进三维边界盒估计。由于三维包围盒估计不准确,其二维投影也很可能与相应的二维方案不匹配。首先估计三维8个点顶点,然后将2D估计的边框投影到3D边框,通过关联3D和2D边框,通过几何一致性约束三维边界盒。
在这里插入图片描述

边界框一致性损失

在训练过程中,我们提出了一个基于点网的三维盒子修正模块2,用于包围盒的细化。3D盒校正模块以分割后的点云和3D盒估计模块提取的特征作为输入,输出3D包围盒参数的校正。在这里插入图片描述

实验结果

1.数据集

实例分割先用Cityspace训练然后用kitti训练

在这里插入图片描述

在这里插入图片描述

这篇关于#每天一篇论文 Monocular 3D Object Detection with Pseudo-LiDAR Point Cloud的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/412557

相关文章

轻量级在线服装3D定制引擎Myway简介

我写的面向web元宇宙轻量级系列引擎中的另外一个,在线3D定制引擎Myway 3D。 用于在线商品定制,比如个性化服装的定制、日常用品(如杯子)、家装(被套)等物品的在线定制。 特性列表: 可更换衣服款式,按需定制更换模型可实时更改材质颜色可实时添加文本,并可实时修改大小、颜色和角度,支持自定义字体可实时添加艺术图标,并可实时修改大小、颜色和角度,支持翻转、各种对齐可更改衣服图案,按需求定制

Spring Cloud:构建分布式系统的利器

引言 在当今的云计算和微服务架构时代,构建高效、可靠的分布式系统成为软件开发的重要任务。Spring Cloud 提供了一套完整的解决方案,帮助开发者快速构建分布式系统中的一些常见模式(例如配置管理、服务发现、断路器等)。本文将探讨 Spring Cloud 的定义、核心组件、应用场景以及未来的发展趋势。 什么是 Spring Cloud Spring Cloud 是一个基于 Spring

XMG 重写- (UIView *)hitTest:(CGPoint)point withEvent:(UIEvent *)event方法

//重写这个方法,来完成一些指定的事件。比如说按钮被遮到下面了,但是我想让点击到这块区域的时候让按钮去相应点击 - (UIView *)hitTest:(CGPoint)point withEvent:(UIEvent *)event {     // 当前坐标系上的点转换到按钮上的点     CGPoint btnP = [self convertPoint:point toVi

POLYGON Horror Carnival - Low Poly 3D Art by Synty

465 个独特的预设模型 一个正在运行的摩天轮和旋转木马 包括10个示例脚本,让嘉年华栩栩如生 ◼ 描述◼ 欢迎来到恐怖嘉年华。这个地方曾经有诱人的音乐,现在却有着令人不安的旋律,暗示着其中令人不安的惊喜。 这场险恶的盛会的真正核心在于演示场景。它使用3D低多边形资源构建,具有来自不祥的狂欢帐篷、摊位、摩天轮、旋转木马等游戏开发资源。它是疯狂人物与毫无戒心的寻求刺激者玩捉迷藏游戏的完美狩猎场。

自动驾驶---Perception之Lidar点云3D检测

1 背景         Lidar点云技术的出现是基于摄影测量技术的发展、计算机及高新技术的推动以及全球定位系统和惯性导航系统的发展,使得通过激光束获取高精度的三维数据成为可能。随着技术的不断进步和应用领域的拓展,Lidar点云技术将在测绘、遥感、环境监测、机器人等领域发挥越来越重要的作用。         目前全球范围内纯视觉方案的车企主要包括特斯拉和集越,在达到同等性能的前提下,纯视觉方

3D模型相关生成

3D模型相关生成 1. DreamFusion Model DreamFusion Model 是一种将文本描述转化为三维模型的技术。你可以想象它是一个“魔法翻译器”,你告诉它一个场景或物体的描述,比如“一个飞翔的龙”,它就能生成一个相应的 3D 模型。 原理: 文本到图像生成:DreamFusion 首先将文本描述转化为一系列可能的 2D 图像。这部分利用了预训练的扩散模型(如 DALL

Python: create object

# encoding: utf-8# 版权所有 2024 涂聚文有限公司# 许可信息查看:# 描述:# Author : geovindu,Geovin Du 涂聚文.# IDE : PyCharm 2023.1 python 3.11# Datetime : 2024/6/15 18:59# User : geovindu# Product :

康奈尔大学之论文审稿模型Reviewer2及我司七月对其的实现(含PeerRead)

前言 自从我司于23年7月开始涉足论文审稿领域之后「截止到24年6月份,我司的七月论文审稿GPT已经迭代到了第五版,详见此文的8.1 七月论文审稿GPT(从第1版到第5版)」,在业界的影响力越来越大,所以身边朋友如发现业界有相似的工作,一般都会第一时间发给我,比如本部分要介绍的康奈尔大学的reviewer2 当然,我自己也会各种看类似工作的论文,毕竟同行之间的工作一定会互相借鉴的,我们会学他们

初学WebGL,使用Three.js开发第一个3d场景示例

使用Three.js 开发3d场景   在图书馆偶然撞见《Three.js开发指南》一书,便试着捣鼓一翻,现将第一个示例的部分代码、注解和相关方法的API记录在此。因为此书发行时是Three.js r69版本,所以当前部分代码有所修改,且所有方法和参数以官方最新版本Three.js r90为准。 <!doctype html><html lang="en"><head><meta char

【论文精读】分类扩散模型:重振密度比估计(Revitalizing Density Ratio Estimation)

文章目录 一、文章概览(一)问题的提出(二)文章工作 二、理论背景(一)密度比估计DRE(二)去噪扩散模型 三、方法(一)推导分类和去噪之间的关系(二)组合训练方法(三)一步精确的似然计算 四、实验(一)使用两种损失对于实现最佳分类器的重要性(二)去噪结果、图像质量和负对数似然 论文:Classification Diffusion Models: Revitalizing