每天一篇论文 305/365 Real Time Dense Depth Estimation by Fusing Stereo with Sparse Depth Measurements

本文主要是介绍每天一篇论文 305/365 Real Time Dense Depth Estimation by Fusing Stereo with Sparse Depth Measurements,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

Real Time Dense Depth Estimation by Fusing Stereo with Sparse Depth Measurements
摘要

我们提出了一种深度估计方法,该方法将来自立体对的信息与来自激光雷达传感器或距离相机的稀疏距离测量相融合。这项工作的目标是利用两种传感器模式的互补优势,精确但稀疏的距离测量和模糊但密集的立体信息。结合各向异性扩散和半全局匹配的思想,有效地融合了这两种源。我们对KITTI 2015和Middlebury 2014数据集的方法进行了评估,使用随机抽样的地面真值范围测量作为稀疏深度输入。我们通过对两个数据集进行少量的范围测量,实现了显著的性能改进。我们还使用PMDTec Monstar传感器从我们的平台提供定性结果。我们的整个流水线运行在NVIDIA TX-2平台上,5Hz,1280×1024立体图像,128个视差级别。

贡献

本文的主要工作有:
(1)结合传统的立体距离融合和深度插值技术,提出了一种将稀疏精确的深度测量数据集成到稠密立体深度估计框架中的方法;
(2) 对我们的方法在KITTI 2015和Middlebury 2014数据集上的定量评估,以及允许在计算受限的移动机器人上进行实时密集深度估计的小计算足迹。

方法

处理过程输入一对校正后的立体图像I(左摄像机)和J(右摄像机)。利用校准后的内、外图像,我们将深度传感器的距离测量值转换成具有匹配焦距的左相机参考帧中的深度图像。设置cost volume::正如在许多立体算法中常见的那样,我们首先将灰度强度图像转换为对强度变化更为鲁棒的特征空间。对左右图像中每个像素周围的窗口应用 census 变换,得到的位向量用Icen(x,y)和Jcen(x,y)表示。
然后计算3D cost volume,其中X和Y轴对应于2D图像坐标和Z轴到视差范围。这个卷C((x,y),d)的每个元素表示一个成本,或者左图像中的变换值与其右边的对应值之间的相似性,在y轴中以D移位,其中在EQ中看到D=1
在这里插入图片描述

对3D cost volume做简化

聚合步骤被描述为一个能量最小化方程,类似于基于扫描线优化的立体方法,在每个像素上沿多个不同方向进行。为了降低计算复杂度,我们考虑4-8个方向,而不是原来的16个方向。SGM算法通过计算沿若干不同说明如下:

在这里插入图片描述

Cost volume

成本量创建阶段引入范围度量,在存在测量差异值的点上更新成本量中的元素(x,y,z)。我们用((xm,ym),dm)表示这些元素。
些测量读数被视为高置信差异估计值,并用于修改原始成本量条目。我们提出了三种不同的方法,

1)Na¨ıve Fusion

在这里插入图片描述

2)Neighborhood Promotion:

在这里插入图片描述

3)Diffusion Based Update:

在这里插入图片描述

结果

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

这篇关于每天一篇论文 305/365 Real Time Dense Depth Estimation by Fusing Stereo with Sparse Depth Measurements的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/179060

相关文章

每天认识几个maven依赖(ActiveMQ+activemq-jaxb+activesoap+activespace+adarwin)

八、ActiveMQ 1、是什么? ActiveMQ 是一个开源的消息中间件(Message Broker),由 Apache 软件基金会开发和维护。它实现了 Java 消息服务(Java Message Service, JMS)规范,并支持多种消息传递协议,包括 AMQP、MQTT 和 OpenWire 等。 2、有什么用? 可靠性:ActiveMQ 提供了消息持久性和事务支持,确保消

AI hospital 论文Idea

一、Benchmarking Large Language Models on Communicative Medical Coaching: A Dataset and a Novel System论文地址含代码 大多数现有模型和工具主要迎合以患者为中心的服务。这项工作深入探讨了LLMs在提高医疗专业人员的沟通能力。目标是构建一个模拟实践环境,人类医生(即医学学习者)可以在其中与患者代理进行医学

论文翻译:arxiv-2024 Benchmark Data Contamination of Large Language Models: A Survey

Benchmark Data Contamination of Large Language Models: A Survey https://arxiv.org/abs/2406.04244 大规模语言模型的基准数据污染:一项综述 文章目录 大规模语言模型的基准数据污染:一项综述摘要1 引言 摘要 大规模语言模型(LLMs),如GPT-4、Claude-3和Gemini的快

论文阅读笔记: Segment Anything

文章目录 Segment Anything摘要引言任务模型数据引擎数据集负责任的人工智能 Segment Anything Model图像编码器提示编码器mask解码器解决歧义损失和训练 Segment Anything 论文地址: https://arxiv.org/abs/2304.02643 代码地址:https://github.com/facebookresear

论文翻译:ICLR-2024 PROVING TEST SET CONTAMINATION IN BLACK BOX LANGUAGE MODELS

PROVING TEST SET CONTAMINATION IN BLACK BOX LANGUAGE MODELS https://openreview.net/forum?id=KS8mIvetg2 验证测试集污染在黑盒语言模型中 文章目录 验证测试集污染在黑盒语言模型中摘要1 引言 摘要 大型语言模型是在大量互联网数据上训练的,这引发了人们的担忧和猜测,即它们可能已

OmniGlue论文详解(特征匹配)

OmniGlue论文详解(特征匹配) 摘要1. 引言2. 相关工作2.1. 广义局部特征匹配2.2. 稀疏可学习匹配2.3. 半稠密可学习匹配2.4. 与其他图像表示匹配 3. OmniGlue3.1. 模型概述3.2. OmniGlue 细节3.2.1. 特征提取3.2.2. 利用DINOv2构建图形。3.2.3. 信息传播与新的指导3.2.4. 匹配层和损失函数3.2.5. 与Super

linux 下Time_wait过多问题解决

转自:http://blog.csdn.net/jaylong35/article/details/6605077 问题起因: 自己开发了一个服务器和客户端,通过短连接的方式来进行通讯,由于过于频繁的创建连接,导致系统连接数量被占用,不能及时释放。看了一下18888,当时吓到了。 现象: 1、外部机器不能正常连接SSH 2、内向外不能够正常的ping通过,域名也不能正常解析。

BERT 论文逐段精读【论文精读】

BERT: 近 3 年 NLP 最火 CV: 大数据集上的训练好的 NN 模型,提升 CV 任务的性能 —— ImageNet 的 CNN 模型 NLP: BERT 简化了 NLP 任务的训练,提升了 NLP 任务的性能 BERT 如何站在巨人的肩膀上的?使用了哪些 NLP 已有的技术和思想?哪些是 BERT 的创新? 1标题 + 作者 BERT: Pre-trainin

[论文笔记]LLM.int8(): 8-bit Matrix Multiplication for Transformers at Scale

引言 今天带来第一篇量化论文LLM.int8(): 8-bit Matrix Multiplication for Transformers at Scale笔记。 为了简单,下文中以翻译的口吻记录,比如替换"作者"为"我们"。 大语言模型已被广泛采用,但推理时需要大量的GPU内存。我们开发了一种Int8矩阵乘法的过程,用于Transformer中的前馈和注意力投影层,这可以将推理所需

CSP-J基础之数学基础 初等数论 一篇搞懂(一)

文章目录 前言声明初等数论是什么初等数论历史1. **古代时期**2. **中世纪时期**3. **文艺复兴与近代**4. **现代时期** 整数的整除性约数什么样的整数除什么样的整数才能得到整数?条件:举例说明:一般化: 判断两个数能否被整除 因数与倍数质数与复合数使用开根号法判定质数哥德巴赫猜想最大公因数与辗转相除法计算最大公因数的常用方法:举几个例子:例子 1: 计算 12 和 18