计算机视觉之三维重建(1)---摄像机几何

2024-03-19 07:20

本文主要是介绍计算机视觉之三维重建(1)---摄像机几何,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

文章目录

  • 一、针孔模型和透镜
    • 1.1 针孔摄像机
    • 1.2 近轴折射模型
    • 1.3 透镜问题
  • 二、摄像机几何
    • 2.1 像平面和像素平面
    • 2.2 齐次坐标下的投影变换
    • 2.3 摄像机倾斜
    • 2.4 规范化摄像机
    • 2.5 世界坐标系
    • 2.6 Faugeras定理
    • 2.7 投影变换性质:
  • 三、其他投影摄像机模型
    • 3.1 弱透视投影摄像机
    • 3.2 正交投影摄像机


一、针孔模型和透镜

1.1 针孔摄像机

 1. 当我们设计摄像机记录世界时,我们首先会想到将胶片直接放到物体的前方,但是此时胶片上某点处的图像信息可能来自物体的多个位置,图像模糊使得我们无法分辨。

在这里插入图片描述

 2. 最早提出小孔成像的是中国的墨子。那如果我们在胶片和物体之间放一个有针孔的隔板,那么就可以实现物体的光线与胶片上的像素点一对一对应。

在这里插入图片描述

 3. 如下图是一个简单的针孔摄像机模型。物体经过针孔呈现在像平面的像是倒立的。为了研究方便,我们人为定义了一个虚拟像平面,上面的图像是正立的。

在这里插入图片描述

 4. 如下图所示通过数学模型建立三维坐标到二维坐标的映射,我们可以确定出摄像机坐标系与像平面坐标系相对应点处的位置关系。

在这里插入图片描述

在这里插入图片描述

 6. 光圈的大小会对成像有影响,当缩小光圈时,成像会越来越清晰,但也会越来越暗。
思考:那如何应对到达胶片的光线变少,我们可以增加透镜来解决。

在这里插入图片描述

在这里插入图片描述

1.2 近轴折射模型

 1. 焦点和焦距的概念图如下:

在这里插入图片描述

 2. 我们仍然可以建立数学模型来表示胶片上像素点与物体发射光线处的对应关系。

在这里插入图片描述

1.3 透镜问题

 1. 使用透镜带来的第一个问题是会造成失焦。透镜问题中的 “失焦” 主要指的是在拍摄过程中,由于焦距调整不当,导致拍摄主体在胶片或传感器上未能形成清晰的图像。具体来说,当物体上离相机较远的点P在胶片上成像时,如果物体上较近的点在胶片上映射到多个位置,那么就无法形成清晰的焦点,从而产生虚像。

在这里插入图片描述

 2. 失焦的原因可以归结为焦距设置的不准确。每个透镜都有一个特定的 “聚焦” 距离,只有在该距离上的物体才能被清晰地成像。此外,景深也是一个重要的因素。景深是指在摄影机镜头或其他成像器前沿能够取得清晰图像的所成影像的景物空间范围。在一定景深范围内,物体能够形成清晰的像;而超出这个范围,物体则可能形成虚像。

 3. 使用透镜带来的第二个问题是会造成径向畸变。透镜问题中的径向畸变是一种常见的光学现象,它主要沿着透镜的半径方向分布。当光线经过透镜时,由于透镜的制造精度或组装工艺的偏差,光线在远离透镜中心的地方比靠近中心的地方更加弯曲,从而导致图像的失真。这种失真在普通廉价的镜头中尤为明显。

在这里插入图片描述

 4. 径向畸变的产生与透镜的曲率半径、折射率以及光线入射角等因素有关。当光线经过透镜时,由于不同位置的光线受到不同程度的折射,导致它们在成像平面上无法准确聚焦,从而产生径向偏移。这种偏移随着离透镜中心距离的增加而变得更加明显。

 径向畸变主要分为两种类型:桶形畸变和枕形畸变。桶形畸变通常表现为图像边缘向中心收缩,使得图像呈现出一种 “桶状” 的效果;而枕形畸变则表现为图像边缘向外扩张,形成一种 “枕状” 的效果。

二、摄像机几何

2.1 像平面和像素平面

 1. 首先,像平面是一个连续的平面,通常用于描述光线通过透镜后在成像介质(如胶片或图像传感器)上形成的图像。在像平面上,每个点都对应着一定的光线强度和颜色信息,从而构成了我们所看到的图像。这个平面的坐标原点一般设定在图像的中心,即主光轴与图像传感器的交点,以便更准确地描述图像的物理位置和关系,常常使用物理单位如毫米来描述像素在图像中的位置。

 而像素平面则是与图像的存储和显示方式紧密相关的离散平面。在数字图像处理中,图像被表示为一个由多个像素组成的矩阵,每个像素都对应着像素平面上的一个点。这些像素点按照一定的规律排列,共同构成了我们看到的数字图像。像素平面的坐标原点通常设定在图像的左上角顶点,这与计算机图像处理中的常见坐标系统相一致。

在这里插入图片描述

 2. 我们需要对小孔成像模型进行修正。由于在像平面和像素平面中坐标系的原点选择位置和物理单位不同,所以我们只需要在像平面下加上偏置和乘上系数就可以了。第二幅图中 α α α β β β 一般是由摄像机自身决定的。

在这里插入图片描述

在这里插入图片描述

 3. 思考 P P P P ′ P' P 的变换是线性的吗? 答:不是线性的,由于 x x x y y y 变化时 z z z 也有可能变化, z z z 并不是一个恒定的常数,所以并不是线性的。

2.2 齐次坐标下的投影变换

 1. 齐次坐标(Homogeneous Coordinate)是一个用于投影几何里的坐标系统。齐次坐标表示法将一个原本是 n 维的向量用一个 n+1 维向量来表示,从而能够表达更多的信息。

在这里插入图片描述

 2. 下面表达式中 P h P_h Ph 代表物体齐次坐标形式(三维), P h ′ P'_h Ph 代表像的齐次坐标形式(像素平面), P h P_h Ph P h ′ P'_h Ph 之间通过一个三行四列的矩阵 M M M 进行变换。

在这里插入图片描述

在这里插入图片描述

2.3 摄像机倾斜

 1. 摄像机倾斜是指摄像机向一侧或者上下方倾斜拍摄的一种摄像技术,主要是由于工艺制作不好的原因。当摄像机发生倾斜时,拍摄到的图像会相应地发生旋转或倾斜。这种旋转或倾斜会导致图像中的物体和背景之间的相对位置发生变化,从而在像素平面上形成新的几何布局。这种几何变换可能会使得原本水平或垂直的线条变得倾斜,或者使得物体的形状和比例发生扭曲。

 2. 摄像机倾斜情况下,变换矩阵 M M M 也要做出相应的改变。

在这里插入图片描述

 3. 综上所示,最终得到的摄像机坐标系下的摄像机模型如下图所示。反映了摄像机坐标系下的物体某处坐标到像素平面的映射。内参数矩阵 K K K α 、 β 、 θ 、 c x 、 c y α、β、θ、c_x、c_y αβθcxcy 五个参数。

在这里插入图片描述

2.4 规范化摄像机

 规范化摄像机通常指的是将摄像机的参数和设置调整到一种标准或基准状态,以确保拍摄出的图像具有一致性、准确性和可预测性。:此时物体所取的位置应该是与摄像机坐标系的中心相对应。

在这里插入图片描述

2.5 世界坐标系

 1. 世界坐标系是系统的绝对坐标系,用于描述物体在三维空间中的位置。在没有建立用户坐标系之前,画面上所有点的坐标都是以该坐标系的原点来确定各自的位置的。世界坐标系通常由三个轴表示,分别是 x x x 轴、 y y y 轴和 z z z 轴,其中 x x x 轴表示东西方向, y y y 轴表示南北方向, z z z 轴表示高度或海拔。每个点在这个坐标系中都有一个独特的坐标值,可以用 ( x , y , z ) (x, y, z) (x,y,z) 的形式表示。

 2. 假设世界坐标系 P w P_w Pw 做一个旋转与平移后转换到摄像机坐标系 P P P(齐次坐标),那么存在旋转矩阵 R R R(三行三列),平移矩阵 T T T(三行一列),对于旋转矩阵有三个自由度,平移矩阵有三个自由度,那么外参数总共有六个自由度。

在这里插入图片描述

 3. 世界坐标系下的摄像机模型如下所示, P w P_w Pw 表示世界坐标系, P ′ P' P 表示像素平面的齐次坐标系。

在这里插入图片描述

 4. 对于旋转矩阵有三个自由度,平移矩阵有三个自由度,那么外参数总共有六个自由度。 同时考虑外参数和内参数情况下,投影矩阵 M M M 有11个自由度。旋转矩阵 R R R(三行三列),平移矩阵 T T T(三行一列)。

在这里插入图片描述

2.6 Faugeras定理

 1. Faugeras定理是一个关于计算机视觉和摄影几何的重要定理,它主要关注于如何从多视图几何中提取场景的三维结构信息。Faugeras定理通常表述为:在给定足够多的视图和相应的摄像机参数的情况下,我们可以唯一地重建出场景的三维结构。这意味着,通过拍摄同一场景的多张照片,并知道每张照片的摄像机参数(如位置、方向、焦距等),我们可以利用这些信息和Faugeras定理来恢复出场景的三维模型。

 2. Faugeras定理介绍如下:

在这里插入图片描述

2.7 投影变换性质:

 1. 在计算机视觉中,投影变换是一个关键概念,它涉及将三维物体或场景投影到二维图像平面的过程。这种变换模拟了光线如何通过摄像机的镜头并在图像传感器上形成图像的过程。

 2. 投影变化的性质如下所示,共有五条,可对应右边的图来理解。

在这里插入图片描述

三、其他投影摄像机模型

3.1 弱透视投影摄像机

 1. 弱透射投影摄像机是一种特殊的摄像机模型,它在投影过程中采用了弱透视投影的原理。在弱透视投影中,像素坐标与三维坐标之间的关系相对简单,通常只需要一个放大系数就可以进行转换。

在这里插入图片描述

 2. 当观察的场景或物体与摄像机很远时,此时观察的场景或物体近似于平面。比如摄像机照一个人,当之间的距离很远时,人的脸可以看成一个平面,那么应用弱透射投影摄像机可以提供相对准确的投影结果。

在这里插入图片描述

3.2 正交投影摄像机

 正交投影摄像机是一种特殊的摄像机,其投影方式遵循正交投影的原理。正交投影是一种投影变换,其中物体在三维空间中的平行线在投影到二维平面上时仍保持平行。这种投影方式在制图、建模等领域中特别常见,因为它能够保持物体的尺寸和形状不变,不产生透视效果。

在这里插入图片描述

这篇关于计算机视觉之三维重建(1)---摄像机几何的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/825212

相关文章

uva 10387 Billiard(简单几何)

题意是一个球从矩形的中点出发,告诉你小球与矩形两条边的碰撞次数与小球回到原点的时间,求小球出发时的角度和小球的速度。 简单的几何问题,小球每与竖边碰撞一次,向右扩展一个相同的矩形;每与横边碰撞一次,向上扩展一个相同的矩形。 可以发现,扩展矩形的路径和在当前矩形中的每一段路径相同,当小球回到出发点时,一条直线的路径刚好经过最后一个扩展矩形的中心点。 最后扩展的路径和横边竖边恰好组成一个直

poj 1113 凸包+简单几何计算

题意: 给N个平面上的点,现在要在离点外L米处建城墙,使得城墙把所有点都包含进去且城墙的长度最短。 解析: 韬哥出的某次训练赛上A出的第一道计算几何,算是大水题吧。 用convexhull算法把凸包求出来,然后加加减减就A了。 计算见下图: 好久没玩画图了啊好开心。 代码: #include <iostream>#include <cstdio>#inclu

uva 1342 欧拉定理(计算几何模板)

题意: 给几个点,把这几个点用直线连起来,求这些直线把平面分成了几个。 解析: 欧拉定理: 顶点数 + 面数 - 边数= 2。 代码: #include <iostream>#include <cstdio>#include <cstdlib>#include <algorithm>#include <cstring>#include <cmath>#inc

XTU 1237 计算几何

题面: Magic Triangle Problem Description: Huangriq is a respectful acmer in ACM team of XTU because he brought the best place in regional contest in history of XTU. Huangriq works in a big compa

计算机毕业设计 大学志愿填报系统 Java+SpringBoot+Vue 前后端分离 文档报告 代码讲解 安装调试

🍊作者:计算机编程-吉哥 🍊简介:专业从事JavaWeb程序开发,微信小程序开发,定制化项目、 源码、代码讲解、文档撰写、ppt制作。做自己喜欢的事,生活就是快乐的。 🍊心愿:点赞 👍 收藏 ⭐评论 📝 🍅 文末获取源码联系 👇🏻 精彩专栏推荐订阅 👇🏻 不然下次找不到哟~Java毕业设计项目~热门选题推荐《1000套》 目录 1.技术选型 2.开发工具 3.功能

poj 3304 几何

题目大意:给出n条线段两个端点的坐标,问所有线段投影到一条直线上,如果这些所有投影至少相交于一点就输出Yes!,否则输出No!。 解题思路:如果存在这样的直线,过投影相交点(或投影相交区域中的点)作直线的垂线,该垂线(也是直线)必定与每条线段相交,问题转化为问是否存在一条直线和所有线段相交。 若存在一条直线与所有线段相交,此时该直线必定经过这些线段的某两个端点,所以枚举任意两个端点即可。

POJ 2318 几何 POJ 2398

给出0 , 1 , 2 ... n 个盒子, 和m个点, 统计每个盒子里面的点的个数。 const double eps = 1e-10 ;double add(double x , double y){if(fabs(x+y) < eps*(fabs(x) + fabs(y))) return 0 ;return x + y ;}struct Point{double x , y

poj 2653 几何

按顺序给一系列的线段,问最终哪些线段处在顶端(俯视图是完整的)。 const double eps = 1e-10 ;double add(double x , double y){if(fabs(x+y) < eps*(fabs(x) + fabs(y))) return 0 ;return x + y ;}struct Point{double x , y ;Point(){}Po

计算机视觉工程师所需的基本技能

一、编程技能 熟练掌握编程语言 Python:在计算机视觉领域广泛应用,有丰富的库如 OpenCV、TensorFlow、PyTorch 等,方便进行算法实现和模型开发。 C++:运行效率高,适用于对性能要求严格的计算机视觉应用。 数据结构与算法 掌握常见的数据结构(如数组、链表、栈、队列、树、图等)和算法(如排序、搜索、动态规划等),能够优化代码性能,提高算法效率。 二、数学基础

java计算机毕设课设—停车管理信息系统(附源码、文章、相关截图、部署视频)

这是什么系统? 资源获取方式在最下方 java计算机毕设课设—停车管理信息系统(附源码、文章、相关截图、部署视频) 停车管理信息系统是为了提升停车场的运营效率和管理水平而设计的综合性平台。系统涵盖用户信息管理、车位管理、收费管理、违规车辆处理等多个功能模块,旨在实现对停车场资源的高效配置和实时监控。此外,系统还提供了资讯管理和统计查询功能,帮助管理者及时发布信息并进行数据分析,为停车场的科学