论文笔记_S2D.65_基于先验LIDAR点云地图的单目相机定位

2023-12-13 22:08

本文主要是介绍论文笔记_S2D.65_基于先验LIDAR点云地图的单目相机定位,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

目录

基本情况

摘要

主要内容

基于单目相机在LIDAR点云地图中定位的流程

A .2D-3D 的线提取

B .2D-3D 线段的匹配

C .线匹配和位姿的优化

实验

总结


基本情况

  • 文章:Monocular Camera Localization in Prior LiDAR Maps with 2D-3D Line Correspondences
  • 作者:Huai Yu1;2, Weikun Zhen2, Wen Yang1, Ji Zhang2 and Sebastian Scherer
  • 编译:点云PCL
  • 来源:arXiv 2020

摘要

目前,视觉和视觉+惯导的里程计(VO&VIO)技术在状态估计中得到了很好的发展,但在回环闭合时不可避免地会出现累积漂移和位姿跳跃。为了克服这些问题,我们提出了一种基于二维-三维直线对应关系的单目定位方法。为了处理LiDAR点云和图像之间的数据和模型的差异,从LiDAR地图中离线提取三维几何线,从视频序列中实时提取鲁棒二维图像直线。通过VIO的位姿的预测,可以有效地获得可能的2D-3D直线对应。然后通过最小化对应点的投影误差和剔除异常点,对相机位姿和二维-三维对应点进行迭代优化。在EurocMav数据集和我们采集的数据集上的实验结果表明,在结构化环境中,该方法可以有效地估计摄像机的姿态,且不会产生累积漂移或姿位姿跳跃。

 

这项工作的主要贡献是使用二维-三维几何直线对应关系估计位姿用于单目定位的方法,有效地将每个关键帧与先前的LiDAR地图相关联。几何线对应对外观变化具有很强的鲁棒性,适用于城市环境中的相机定位。下图显示了在LiDAR地图中具有2D-3D直线对应和估计的相机位姿的图像。

图片

本文提出的在现有的道路LiDAR地图中的单目定位系统的应用。右侧的激光雷达地图按高度着色。红色和绿色轨迹分别是VINS Mono和我们的结果。左上角的图像显示三维直线投影(绿色)使用估计的VINS Mono姿态(有遮挡)和提取的二维直线(红色),而左下角的图像使用提出的方法的姿态估计的二维-三维直线对应的关系图。

主要内容

该方法可同时估计六自由度相机姿态和二维-三维线对应关系。通过最小化三维直线重投影误差来优化相机位姿,而精确的相机姿态有助于剔除离群点。在大尺度的三维LiDAR点云地图上离线提取三维线特征,作为实时二维-三维对应估计的前期工作。同时,PnP解算对手动标记的2D-3D点对应关系给出第一帧的粗略姿态初始值。然后利用VINS-Mono预测相机在相邻关键帧之间的运动。利用预测的姿态,提取相机的视场(FoV)中的局部3D线,并与从图像序列中在线提取的2D线直接匹配。最后,迭代更新相机姿态和2D-3D对应关系,流程如图所示。

图片

基于单目相机在LIDAR点云地图中定位的流程

A .2D-3D 的线提取

在城市环境中,几何结构通常用线段和平面来表示。这里使用基于分割的三维直线检测方法从激光雷达点云地图中提取三维直线。其基本思想是将点云聚类成平面区域,利用等高线拟合得到三维线段。该方法对大规模无组织点云具有良好的鲁棒性和有效性。尽管处理数百万个点需要时间,但在我们开始跟踪之前,所有地图的3D线只提取一次。

对于二维直线的提取,需要提取出与三维直线一致、对噪声具有鲁棒性的重要的二维几何直线。这在城市场景中是一个挑战,因为大量的纹理噪声会分割出较多的二维线段,并且在颜色均匀的结构(如白墙)上的二维图像中一些几何边缘是不可见的。计算机视觉算法中提出了许多最先进的线段检测(LSD)方法,传统的方法在CPU上运行效率很高。然而,检测到的线段散乱有噪声的,如左图。这些零散且噪声特征会产生大量的2D-3D匹配异常值。考虑到线的完整性和对噪声的鲁棒性,最后采用了一种基于学习的LSD算法,它利用attraction field map(AFM)将LSD问题转化为基于颜色的区域生长问题。

图片

二维图像上线段检测不同方法的比较

B .2D-3D 线段的匹配

对于单帧图像,获取2D-3D对应关系的主要步骤包括初始摄相机姿态预测、3D直线检测和单个2D-3D直线对应关系估计。在这里,在相机FoV中的3D线的提取有助于提高效率,因为FoV中的局部3D线与3D地图中的所有3D线相比非常有限。考虑到仅对三维线图进行遮挡检测比较困难,在不丢弃遮挡线的前提下,将所有的三维线保持在视场中。

图片

三维线段是否在视场中的检查

•如果两个端点都在视场中(图(a)),则将整个三维线段保持为局部可视特征。

•当只有一个端点处于视场(图(b))时,我们从可视点以0:1的线长比例在3D线上迭代采样新的3D点,并检查新采样点的可见性。生成的具有视场中最长长度的三维线段子集被存储为局部可视特征。

•如图(c)所示,当两个端点都不在视野范围内,但一个子集在视野范围内时,我们也可以采样点来提取一个子集。然而,大多数不可视的地图线段在这种情况下,为了效率放弃了三维线段与两个端点的在视场外的情况。

C .线匹配和位姿的优化

对于单个帧,可以通过将两个三维线段的端点投影的点到无穷远直线距离最小化到相应的二维直线距离来优化相机姿态。估计相机姿态Pt的李代数表示为ξt,无限长二维直线的系数向量为H=abc。目标函数是最小化所有2D-3D对应之间的投影误差:

图片

然而,单帧2D-3D对应观测值针对实时的相机定位的鲁棒性是不够。当视场中的三维直线在三维空间中受限或平行时,二维-三维对应关系不能约束六自由度姿态。此外,即使对应关系足够用于姿态估计,二维和三维直线的几何定位噪声也会使估计在真实姿态附近不稳定。为了解决这些问题,利用滑动窗口来添加更多先前的对应观测,以优化当前姿势Pt(如图所示)

图片

 基于滑动窗口的位姿优化

 

实验

该方法在两个不同的真实数据集上进行了测试。第一个实验是在公开的EuRoC MAV数据集上进行的,数据集中包含了地面真实轨迹。并且,我们在不同条件下对Realsense D435i相机采集的数据集进行了实验,以验证方案的性能。测试电脑是一个英特尔核心i7-4790K处理器,32GB内存,和一个Nvidia GeForce GTX 980Ti图形处理器。GPU仅用于二维测线。

图片

EuRoC MAV数据集上的相机定位结果。左上角的图像显示了使用VINS-Mono提取的2D线段(红色)和投影的3D线(绿色)(有遮挡),左下角显示了使用我们的方法的2D-3D对应。右图显示了估计的轨迹(绿色)与激光雷达地图中的真值(红色)对齐的结果。

图片

在EuRoC MAV数据集上运行了5次 ATE RMSE的统计结果

图片

不同长度的线段的RPE ( The average relative pose errors)RMSE统计结果

图片

相对轨迹误差箱线图

为了进一步评估我们的方法在不同的环境下,测试了我们自己采集的室内走廊和室外建筑物数据集。Intel RealSense D435i摄像头用于采集同步图像和IMU数据。全局快门成像仪用同步的IMU数据(200Hz)捕获单目图像序列(640×480像素,30Hz,红外投影仪关闭)。激光雷达地图是通过配准FARO扫描仪focus3D S的几次扫描点云数获得的,如图所示。

图片

三个场景激光雷达点云地图

图片

室外环境下的相机的定位结果

图片

自采数据集中的定位误差

总结

在这篇论文中提出了在预先构建的结构化的LiDAR点云地图环境中,使用单目相机进行定位的方法。该方法利用LiDAR地图中的三维几何直线和图像中检测的鲁棒的二维直线,基于VINS-Mono的相机运动预测的位姿,有效地获得了粗略的二维-三维直线对应关系。这种二维-三维对应的位姿优化方法能够在不进行回环检测的情况下,降低了VIO系统的位姿估计的漂移。并进行了数据集的定性和定量分析结果表明,该方法能有效地获得可靠的二维-三维对应关系和精确的相机姿态。

这篇关于论文笔记_S2D.65_基于先验LIDAR点云地图的单目相机定位的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/490134

相关文章

无人叉车3d激光slam多房间建图定位异常处理方案-墙体画线地图切分方案

墙体画线地图切分方案 针对问题:墙体两侧特征混淆误匹配,导致建图和定位偏差,表现为过门跳变、外月台走歪等 ·解决思路:预期的根治方案IGICP需要较长时间完成上线,先使用切分地图的工程化方案,即墙体两侧切分为不同地图,在某一侧只使用该侧地图进行定位 方案思路 切分原理:切分地图基于关键帧位置,而非点云。 理论基础:光照是直线的,一帧点云必定只能照射到墙的一侧,无法同时照到两侧实践考虑:关

AI hospital 论文Idea

一、Benchmarking Large Language Models on Communicative Medical Coaching: A Dataset and a Novel System论文地址含代码 大多数现有模型和工具主要迎合以患者为中心的服务。这项工作深入探讨了LLMs在提高医疗专业人员的沟通能力。目标是构建一个模拟实践环境,人类医生(即医学学习者)可以在其中与患者代理进行医学

【学习笔记】 陈强-机器学习-Python-Ch15 人工神经网络(1)sklearn

系列文章目录 监督学习:参数方法 【学习笔记】 陈强-机器学习-Python-Ch4 线性回归 【学习笔记】 陈强-机器学习-Python-Ch5 逻辑回归 【课后题练习】 陈强-机器学习-Python-Ch5 逻辑回归(SAheart.csv) 【学习笔记】 陈强-机器学习-Python-Ch6 多项逻辑回归 【学习笔记 及 课后题练习】 陈强-机器学习-Python-Ch7 判别分析 【学

系统架构师考试学习笔记第三篇——架构设计高级知识(20)通信系统架构设计理论与实践

本章知识考点:         第20课时主要学习通信系统架构设计的理论和工作中的实践。根据新版考试大纲,本课时知识点会涉及案例分析题(25分),而在历年考试中,案例题对该部分内容的考查并不多,虽在综合知识选择题目中经常考查,但分值也不高。本课时内容侧重于对知识点的记忆和理解,按照以往的出题规律,通信系统架构设计基础知识点多来源于教材内的基础网络设备、网络架构和教材外最新时事热点技术。本课时知识

2、PF-Net点云补全

2、PF-Net 点云补全 PF-Net论文链接:PF-Net PF-Net (Point Fractal Network for 3D Point Cloud Completion)是一种专门为三维点云补全设计的深度学习模型。点云补全实际上和图片补全是一个逻辑,都是采用GAN模型的思想来进行补全,在图片补全中,将部分像素点删除并且标记,然后卷积特征提取预测、判别器判别,来训练模型,生成的像

基于UE5和ROS2的激光雷达+深度RGBD相机小车的仿真指南(五):Blender锥桶建模

前言 本系列教程旨在使用UE5配置一个具备激光雷达+深度摄像机的仿真小车,并使用通过跨平台的方式进行ROS2和UE5仿真的通讯,达到小车自主导航的目的。本教程默认有ROS2导航及其gazebo仿真相关方面基础,Nav2相关的学习教程可以参考本人的其他博客Nav2代价地图实现和原理–Nav2源码解读之CostMap2D(上)-CSDN博客往期教程: 第一期:基于UE5和ROS2的激光雷达+深度RG

论文翻译:arxiv-2024 Benchmark Data Contamination of Large Language Models: A Survey

Benchmark Data Contamination of Large Language Models: A Survey https://arxiv.org/abs/2406.04244 大规模语言模型的基准数据污染:一项综述 文章目录 大规模语言模型的基准数据污染:一项综述摘要1 引言 摘要 大规模语言模型(LLMs),如GPT-4、Claude-3和Gemini的快

论文阅读笔记: Segment Anything

文章目录 Segment Anything摘要引言任务模型数据引擎数据集负责任的人工智能 Segment Anything Model图像编码器提示编码器mask解码器解决歧义损失和训练 Segment Anything 论文地址: https://arxiv.org/abs/2304.02643 代码地址:https://github.com/facebookresear

数学建模笔记—— 非线性规划

数学建模笔记—— 非线性规划 非线性规划1. 模型原理1.1 非线性规划的标准型1.2 非线性规划求解的Matlab函数 2. 典型例题3. matlab代码求解3.1 例1 一个简单示例3.2 例2 选址问题1. 第一问 线性规划2. 第二问 非线性规划 非线性规划 非线性规划是一种求解目标函数或约束条件中有一个或几个非线性函数的最优化问题的方法。运筹学的一个重要分支。2

【C++学习笔记 20】C++中的智能指针

智能指针的功能 在上一篇笔记提到了在栈和堆上创建变量的区别,使用new关键字创建变量时,需要搭配delete关键字销毁变量。而智能指针的作用就是调用new分配内存时,不必自己去调用delete,甚至不用调用new。 智能指针实际上就是对原始指针的包装。 unique_ptr 最简单的智能指针,是一种作用域指针,意思是当指针超出该作用域时,会自动调用delete。它名为unique的原因是这个