GEDepth：Ground Embedding for Monocular Depth Estimation

2024-02-02 14:44

文章标签 estimation embedding monocular depth ground gedepth

本文主要是介绍GEDepth：Ground Embedding for Monocular Depth Estimation，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

参考代码：gedepth

出发点与动机
相机的外参告诉了相机在世界坐标系下的位置信息，那么可以用这个外参构建一个地面基础深度作为先验，后续只需要在这个地面基础深度先验基础上添加offset就可以得到结果深度，这样可以极大简化深度估计网络学习的难度，自然深度估计的性能就上去了。先不说这个深度估计的实际效果如何，但是这个将复杂的问题简单化的思路是可以借鉴的。但是这个鲁棒性如何就需要打问号了，BEV感知中外参的变化带来的问题依然很头疼。

方法设计
文章的核心内容部分在左上部分，也就是如何去构建地面基础深度，文中给出了两种地面深度生成的方法：内外参映射、地面坡度加内外参，自然第二种的精度更高。这个基础深度再同你过一个学习到的加权参数 $M_{atten}$ 去调和基础深度和网络本身预测的深度
在这里插入图片描述

单纯由内外参估计地面深度
这个借助内外参可以在平直路面实现基础地面深度估计，什么路面坡度、障碍物什么的都不考虑，单纯计算地面的深度。其计算出来的效果如下
在这里插入图片描述

借助地面坡度预测细化地面基础深度
单纯依靠内外参得到的地面基础深度是相当粗糙的，完全不能用，那么可以借用下图定义的路面坡度 $\alpha$ 来细化路面的实际情况，这个坡度的计算自然也需要预先通过真值计算得到，相当于是对真值在不同的维度做了监督
在这里插入图片描述

实验结果
KITTI上的性能比较：
在这里插入图片描述

DDAD数据集：
在这里插入图片描述

这篇关于GEDepth：Ground Embedding for Monocular Depth Estimation的文章就介绍到这儿，希望我们推荐的文章对编程师们有所帮助！

http://www.chinasem.cn/article/671046。 23002807@qq.com

相关文章

PyTorch中的词嵌入层(nn.Embedding)详解与实战应用示例

PyTorch中的词嵌入层(nn.Embedding)详解与实战应用示例

《PyTorch中的词嵌入层(nn.Embedding)详解与实战应用示例》词嵌入解决NLP维度灾难,捕捉语义关系,PyTorch的nn.Embedding模块提供灵活实现,支持参数配置、预训练及变长... 目录一、词嵌入(Word Embedding)简介为什么需要词嵌入？二、PyTorch中的nn.Em

阅读更多...

【生成模型系列（初级）】嵌入（Embedding）方程——自然语言处理的数学灵魂【通俗理解】

【生成模型系列（初级）】嵌入（Embedding）方程——自然语言处理的数学灵魂【通俗理解】

【通俗理解】嵌入（Embedding）方程——自然语言处理的数学灵魂关键词提炼 #嵌入方程 #自然语言处理 #词向量 #机器学习 #神经网络 #向量空间模型 #Siri #Google翻译 #AlexNet 第一节：嵌入方程的类比与核心概念【尽可能通俗】嵌入方程可以被看作是自然语言处理中的“翻译机”，它将文本中的单词或短语转换成计算机能够理解的数学形式，即向量。正如翻译机将一种语言

阅读更多...

【CSS in Depth 2 精译_023】第四章概述 + 4.1 Flexbox 布局的基本原理

【CSS in Depth 2 精译_023】第四章概述 + 4.1 Flexbox 布局的基本原理

当前内容所在位置（可进入专栏查看其他译好的章节内容）第一章层叠、优先级与继承（已完结） 1.1 层叠1.2 继承1.3 特殊值1.4 简写属性1.5 CSS 渐进式增强技术1.6 本章小结第二章相对单位（已完结） 2.1 相对单位的威力2.2 em 与 rem2.3 告别像素思维2.4 视口的相对单位2.5 无单位的数值与行高2.6 自定义属性2.7 本章小结第三章文档流与盒模型（已

阅读更多...

【CSS in Depth 2 精译_024】4.2 弹性子元素的大小

【CSS in Depth 2 精译_024】4.2 弹性子元素的大小

当前内容所在位置（可进入专栏查看其他译好的章节内容）第一章层叠、优先级与继承（已完结） 1.1 层叠1.2 继承1.3 特殊值1.4 简写属性1.5 CSS 渐进式增强技术1.6 本章小结第二章相对单位（已完结） 2.1 相对单位的威力2.2 em 与 rem2.3 告别像素思维2.4 视口的相对单位2.5 无单位的数值与行高2.6 自定义属性2.7 本章小结第三章文档流与盒模型（已

阅读更多...

$MonoHuman: Animatable Human Neural Field from Monocular Video 翻译$

MonoHuman: Animatable Human Neural Field from Monocular Video 翻译

MonoHuman：来自单目视频的可动画人类神经场摘要。利用自由视图控制来动画化虚拟化身对于诸如虚拟现实和数字娱乐之类的各种应用来说是至关重要的。已有的研究试图利用神经辐射场（NeRF）的表征能力从单目视频中重建人体。最近的工作提出将变形网络移植到NeRF中，以进一步模拟人类神经场的动力学，从而动画化逼真的人类运动。然而，这种流水线要么依赖于姿态相关的表示，要么由于帧无关的优化而缺乏运动一致性

阅读更多...

$HumanNeRF:Free-viewpoint Rendering of Moving People from Monocular Video 翻译$

HumanNeRF:Free-viewpoint Rendering of Moving People from Monocular Video 翻译

HumanNeRF：单目视频中运动人物的自由视点绘制引言。我们介绍了一种自由视点渲染方法- HumanNeRF -它适用于一个给定的单眼视频ofa人类执行复杂的身体运动，例如，从YouTube的视频。我们的方法可以在任何帧暂停视频，并从任意新的摄像机视点或甚至针对该特定帧和身体姿势的完整360度摄像机路径渲染主体。这项任务特别具有挑战性，因为它需要合成身体的照片级真实感细节，如从输入视频中可能

阅读更多...

【AIGC】Transformer模型：Postion Embedding概述、应用场景和实现方式的详细介绍。

【AIGC】Transformer模型：Postion Embedding概述、应用场景和实现方式的详细介绍。

🏆🏆欢迎大家来到我们的天空🏆🏆 🏆🏆如果文章内容对您有所触动，别忘了点赞、关注，收藏！ 🏆 作者简介：我们的天空 🏆《头衔》：大厂高级软件测试工程师，阿里云开发者社区专家博主，CSDN人工智能领域新星创作者。 🏆《博客》：人工智能，深度学习，机器学习，python，自然语言处理，AIGC等分享。所属的专栏：TensorFlow项目开发实战，人工智能技术 🏆🏆主页：我们

阅读更多...

深入RAG优化：BGE词嵌入全解析与Landmark Embedding新突破

深入RAG优化：BGE词嵌入全解析与Landmark Embedding新突破

前面已经写过一篇关于Embedding选型的文章，《如何高效选择RAG的中文Embedding模型？揭秘最佳实践与关键标准！》，主要介绍通过开源网站的下载量和测评效果选择Embedding模型。一、Embedding选型建议与结果选型建议： 1、大部分模型的序列长度是 512 tokens。8192 可尝试 tao-8k，1024 可尝试 stella。 2、在专业数据领域上，嵌入

阅读更多...

关于NLP的word Embedding

关于NLP的word Embedding

Embedding在数学上表示一个maping, f: X -> Y，也就是一个function，其中该函数是injective（就是我们所说的单射函数，每个Y只有唯一的X对应，反之亦然）和structure-preserving (结构保存，比如在X所属的空间上X1 < X2,那么映射后在Y所属空间上同理 Y1 < Y2)。那么对于word embedding，就是将单词word映射到另外

阅读更多...

Maximum Depth of N-ary Tree

Maximum Depth of N-ary Tree

Input: root = [1,null,2,3,4,5,null,null,6,7,null,8,null,9,10,null,null,11,null,12,null,13,null,null,14]Output: 5 思路1：DFS ，divide and conquer /*// Definition for a Node.class Node {public int v

阅读更多...