【CVPR‘24】深度补全:Flexible Depth Completion for Sparse and Varying Point Densities

本文主要是介绍【CVPR‘24】深度补全:Flexible Depth Completion for Sparse and Varying Point Densities,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

【CVPR'24】深度补全:Flexible Depth Completion for Sparse and Varying Point Densities

    • 摘要
    • 1. 引言
    • 3. 方法
      • 3.1 基础深度估计架构
      • 3.2 基于亲和度的偏移校正
      • 3.3 校正置信度预测
      • 3.4 联合深度估计与完成
      • 3.5 损失
    • 4. 实验
      • 4.1 数据集和评估指标
      • 4.2 实验概述
      • 4.3 消融研究
  • 参考文献

摘要

近年来,深度补全方法在填充相对密集的深度图(例如,在 KITTI 数据集上投影的 64 线 LiDAR 或 NYUv2 上采样的 500 个点)时取得了显著的成果。然而,这些方法在处理非常稀疏的输入(例如 4 线 LiDAR 或 32 个深度点测量值)时的表现尚未得到验证。这些更稀疏的场景带来了新的挑战,例如与 64 线 LiDAR 相比,4 线 LiDAR 使得没有深度的像素与其最近的深度点之间的距离增加了六倍,从 5 个像素增加到 30 个像素。观察到现有方法在处理稀疏和可变分布的深度图时表现不佳,我们提出了一种基于亲和度的偏移校正(ASC)模块,该模块通过预测的图像像素与深度点之间的亲和度,迭代地将深度预测与输入深度对齐。我们的框架使每个深度点能够自适应地影响并改进整个图像的预测,从而在更少线、更少点和可变稀疏设置中获得大幅改进的结果。此外,我们展示了从 KITTI 到 nuScenes 以及从随机采样到不规则点分布的域迁移中性能的改进。我们的校正模块可以轻松添加到任何深度补全或仅 RGB 深度估计模型中,特别是允许后者使用单个模型执行完成和估计任务。

1. 引言

最近在深度补全方面的进展主要集中在对 KITTI 数据集中通过投影 64 线 LiDAR 到 RGB 图像上或从 NYUv2 数据集中随机采样 500 个深度点进行密集化处理。虽然这些方法在

这篇关于【CVPR‘24】深度补全:Flexible Depth Completion for Sparse and Varying Point Densities的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1118358

相关文章

2、PF-Net点云补全

2、PF-Net 点云补全 PF-Net论文链接:PF-Net PF-Net (Point Fractal Network for 3D Point Cloud Completion)是一种专门为三维点云补全设计的深度学习模型。点云补全实际上和图片补全是一个逻辑,都是采用GAN模型的思想来进行补全,在图片补全中,将部分像素点删除并且标记,然后卷积特征提取预测、判别器判别,来训练模型,生成的像

基于UE5和ROS2的激光雷达+深度RGBD相机小车的仿真指南(五):Blender锥桶建模

前言 本系列教程旨在使用UE5配置一个具备激光雷达+深度摄像机的仿真小车,并使用通过跨平台的方式进行ROS2和UE5仿真的通讯,达到小车自主导航的目的。本教程默认有ROS2导航及其gazebo仿真相关方面基础,Nav2相关的学习教程可以参考本人的其他博客Nav2代价地图实现和原理–Nav2源码解读之CostMap2D(上)-CSDN博客往期教程: 第一期:基于UE5和ROS2的激光雷达+深度RG

韦季李输入法_输入法和鼠标的深度融合

在数字化输入的新纪元,传统键盘输入方式正悄然进化。以往,面对实体键盘,我们常需目光游离于屏幕与键盘之间,以确认指尖下的精准位置。而屏幕键盘虽直观可见,却常因占据屏幕空间,迫使我们在操作与视野间做出妥协,频繁调整布局以兼顾输入与界面浏览。 幸而,韦季李输入法的横空出世,彻底颠覆了这一现状。它不仅对输入界面进行了革命性的重构,更巧妙地将鼠标这一传统外设融入其中,开创了一种前所未有的交互体验。 想象

免费也能高质量!2024年免费录屏软件深度对比评测

我公司因为客户覆盖面广的原因经常会开远程会议,有时候说的内容比较广需要引用多份的数据,我记录起来有一定难度,所以一般都用录屏工具来记录会议内容。这次我们来一起探索有什么免费录屏工具可以提高我们的工作效率吧。 1.福晰录屏大师 链接直达:https://www.foxitsoftware.cn/REC/  录屏软件录屏功能就是本职,这款录屏工具在录屏模式上提供了多种选项,可以选择屏幕录制、窗口

动手学深度学习【数据操作+数据预处理】

import osos.makedirs(os.path.join('.', 'data'), exist_ok=True)data_file = os.path.join('.', 'data', 'house_tiny.csv')with open(data_file, 'w') as f:f.write('NumRooms,Alley,Price\n') # 列名f.write('NA

深度优先(DFS)和广度优先(BFS)——算法

深度优先 深度优先搜索算法(英语:Depth-First-Search,DFS)是一种用于遍历或搜索树或图的算法。 沿着树的深度遍历树的节点,尽可能深的搜索树的分支,当节点v的所在边都己被探寻过,搜索将回溯到发现节点v的那条边的起始节点。这一过程一直进行到已发现从源节点可达的所有节点为止。如果还存在未被发现的节点,则选择其中一个作为源节点并重复以上过程,整个进程反复进行直到所有节点都被访

图解TCP三次握手|深度解析|为什么是三次

写在前面 这篇文章我们来讲解析 TCP三次握手。 TCP 报文段 传输控制块TCB:存储了每一个连接中的一些重要信息。比如TCP连接表,指向发送和接收缓冲的指针,指向重传队列的指针,当前的发送和接收序列等等。 我们再来看一下TCP报文段的组成结构 TCP 三次握手 过程 假设有一台客户端,B有一台服务器。最初两端的TCP进程都是处于CLOSED关闭状态,客户端A打开链接,服务器端

java线程深度解析(六)——线程池技术

http://blog.csdn.net/Daybreak1209/article/details/51382604 一种最为简单的线程创建和回收的方法: [html]  view plain copy new Thread(new Runnable(){                @Override               public voi

java线程深度解析(五)——并发模型(生产者-消费者)

http://blog.csdn.net/Daybreak1209/article/details/51378055 三、生产者-消费者模式     在经典的多线程模式中,生产者-消费者为多线程间协作提供了良好的解决方案。基本原理是两类线程,即若干个生产者和若干个消费者,生产者负责提交用户请求任务(到内存缓冲区),消费者线程负责处理任务(从内存缓冲区中取任务进行处理),两类线程之

java线程深度解析(四)——并发模型(Master-Worker)

http://blog.csdn.net/daybreak1209/article/details/51372929 二、Master-worker ——分而治之      Master-worker常用的并行模式之一,核心思想是由两个进程协作工作,master负责接收和分配任务,worker负责处理任务,并把处理结果返回给Master进程,由Master进行汇总,返回给客