3DIoUMatch: Leveraging IoU Prediction for Semi-Supervised 3D Object Detection

本文主要是介绍3DIoUMatch: Leveraging IoU Prediction for Semi-Supervised 3D Object Detection,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

3DIoUMatch: Leveraging IoU Prediction for Semi-Supervised 3D Object Detection

论文链接:https://arxiv.org/pdf/2012.04355.pdf
代码链接:https://github.com/yezhen17/3DIoUMatch
作者单位:Stanford University等
发表平台:CVPR 2021

1. 摘要(Abstract)

     半监督领域伪标签存在问题:

  • 只使用teacher network预测出的pseudo-label并不准,含噪太多,根本没法训练
    • 分类得分进行过滤,还是含噪太多;
    • 基于IoU的定位难点是难以设置合适的阈值。如果阈值太低,噪声过多;如果阈值太高,保留下来的pseudo label太少,不利于训练

2. 相关工作(Related Work)

3. 文章主体

     因此,作者提出了一种two-stage的过滤策略:输入label和unlabel data → label data直接送入student network,unlabel data送入teacher network得到pseudo label → labels 和pseudo labels用于监督student训练,如下图。

在这里插入图片描述

  • 如何对indoor和outdoor scene同时有效:
    • 分别采用了两个不同的框架处理不同场景的任务,利用VoteNet处理indoor scene,利用PV-RCNN处理outdoor scene
  • 生成高质量的pseudo label:直接只用pseudo label或者只利用classification进行过滤,并不能取得好的效果。因此,尝试引入IoU作为localization score。基于IoU的过滤可分为两个阶段(two-stage):
    • 第一阶段:用一个比较低的IoU阈值进行第一次过滤,但是过滤完依然会存在大量的重复框
    • 第二阶段:利用改进的NMS去除重复框。这里作者有两点考量:
      • 1.作者认为通用的NMS仅仅使用了object score而忽略了localization score,因此不太准;
      • 2.作者认为并不用完全去除重复框,因为过于苛刻的阈值设计会导致pseudo label特别少从而影响student network的训练。所以,作者考虑了一种lower-half suppression,其实就是把重复框按照分类得分和定位得分去除一半。

4. 实验效果

定量结果

  • 在ScanNet和SUN RGB-D上的结果
    在这里插入图片描述

  • 在KITTI数据集上1% labeled的结果

在这里插入图片描述

消融实验

可视化结果

在这里插入图片描述

在这里插入图片描述

这篇关于3DIoUMatch: Leveraging IoU Prediction for Semi-Supervised 3D Object Detection的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/739404

相关文章

无人叉车3d激光slam多房间建图定位异常处理方案-墙体画线地图切分方案

墙体画线地图切分方案 针对问题:墙体两侧特征混淆误匹配,导致建图和定位偏差,表现为过门跳变、外月台走歪等 ·解决思路:预期的根治方案IGICP需要较长时间完成上线,先使用切分地图的工程化方案,即墙体两侧切分为不同地图,在某一侧只使用该侧地图进行定位 方案思路 切分原理:切分地图基于关键帧位置,而非点云。 理论基础:光照是直线的,一帧点云必定只能照射到墙的一侧,无法同时照到两侧实践考虑:关

MiniGPT-3D, 首个高效的3D点云大语言模型,仅需一张RTX3090显卡,训练一天时间,已开源

项目主页:https://tangyuan96.github.io/minigpt_3d_project_page/ 代码:https://github.com/TangYuan96/MiniGPT-3D 论文:https://arxiv.org/pdf/2405.01413 MiniGPT-3D在多个任务上取得了SoTA,被ACM MM2024接收,只拥有47.8M的可训练参数,在一张RTX

SAM2POINT:以zero-shot且快速的方式将任何 3D 视频分割为视频

摘要 我们介绍 SAM2POINT,这是一种采用 Segment Anything Model 2 (SAM 2) 进行零样本和快速 3D 分割的初步探索。 SAM2POINT 将任何 3D 数据解释为一系列多向视频,并利用 SAM 2 进行 3D 空间分割,无需进一步训练或 2D-3D 投影。 我们的框架支持各种提示类型,包括 3D 点、框和掩模,并且可以泛化到不同的场景,例如 3D 对象、室

【Python报错已解决】AttributeError: ‘list‘ object has no attribute ‘text‘

🎬 鸽芷咕:个人主页  🔥 个人专栏: 《C++干货基地》《粉丝福利》 ⛺️生活的理想,就是为了理想的生活! 文章目录 前言一、问题描述1.1 报错示例1.2 报错分析1.3 解决思路 二、解决方法2.1 方法一:检查属性名2.2 步骤二:访问列表元素的属性 三、其他解决方法四、总结 前言 在Python编程中,属性错误(At

时间序列|change point detection

change point detection 被称为变点检测,其基本定义是在一个序列或过程中,当某个统计特性(分布类型、分布参数)在某时间点受系统性因素而非偶然因素影响发生变化,我们就称该时间点为变点。变点识别即利用统计量或统计方法或机器学习方法将该变点位置估计出来。 Change Point Detection的类型 online 指连续观察某一随机过程,监测到变点时停止检验,不运用到

模具要不要建设3D打印中心

随着3D打印技术的日益成熟与广泛应用,模具企业迎来了自建3D打印中心的热潮。这一举措不仅为企业带来了前所未有的发展机遇,同时也伴随着一系列需要克服的挑战,如何看待企业引进增材制造,小编为您全面分析。 机遇篇: 加速产品创新:3D打印技术如同一把钥匙,为模具企业解锁了快速迭代产品设计的可能。企业能够迅速将创意转化为实体模型,缩短产品从设计到市场的周期,抢占市场先机。 强化定制化服务:面

论文精读-Supervised Raw Video Denoising with a Benchmark Dataset on Dynamic Scenes

论文精读-Supervised Raw Video Denoising with a Benchmark Dataset on Dynamic Scenes 优势 1、构建了一个用于监督原始视频去噪的基准数据集。为了多次捕捉瞬间,我们手动为对象s创建运动。在高ISO模式下捕获每一时刻的噪声帧,并通过对多个噪声帧进行平均得到相应的干净帧。 2、有效的原始视频去噪网络(RViDeNet),通过探

WPF入门到跪下 第十三章 3D绘图 - 3D绘图基础

3D绘图基础 四大要点 WPF中的3D绘图涉及4个要点: 视口,用来驻留3D内容3D对象照亮部分或整个3D场景的光源摄像机,提供在3D场景中进行观察的视点 一、视口 要展示3D内容,首先需要一个容器来装载3D内容。在WPF中,这个容器就是Viewport3D(3D视口),它继承自FrameworkElement,因此可以像其他元素那样在XAML中使用。 Viewport3D与其他元素相

error while loading shared libraries: libnuma.so.1: cannot open shared object file:

腾讯云CentOS,安装Mysql时: 1.yum remove libnuma.so.1 2.yum install numactl.x86_64

java基础总结12-面向对象8(Object类)

1 Object类介绍 Object类在JAVA里面是一个比较特殊的类,JAVA只支持单继承,子类只能从一个父类来继承,如果父类又是从另外一个父类继承过来,那他也只能有一个父类,父类再有父类,那也只能有一个,JAVA为了组织这个类组织得比较方便,它提供了一个最根上的类,相当于所有的类都是从这个类继承,这个类就叫Object。所以Object类是所有JAVA类的根基类,是所有JAVA类的老祖宗