本文主要是介绍摄像机标定学习笔记(4),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
转载自:知乎用户 陈明猷
补充回答题主的问题:
1.为什么要用多张标定板图片做标定?具体数学实现题主可以自行找文献,这里只说原理。单目标定说白了其实就是解一个矩阵方程,其未知量是内、外参数矩阵。
根据线性代数,把解矩阵方程转化成解方程组的问题,由于一张棋盘格只能提供8条相互独立的方程(具体原因请查阅透视变换原理),所以不足以求出10个未知数。理论上,只需2个棋盘格便足够解出全部参数了,但是matlab、opencv等为了增强鲁棒性,还内设了优化方法,使用更多的棋盘格也就是用更多的信息来求得最优解。感谢这些大神吧。
2.如何摆放标定板?
刚才说了,要这么多棋盘格图片其实是为了获得更多的图像坐标-世界坐标信息,进而做优化,得到标定参数的最优解。所以摆放的选择只有一个:彼此位姿越不同越好。
位姿越不同的两张棋盘格图片,其利用角点坐标建立的方程就越独立,越有代表性。可以用极限法去理解上面的话:假如每张棋盘摆放都完全一样,那就算拍了一万张标定板图片,也只能提供8条相互独立的方程,依然解不了方程组。
-------------------------------------下面是原回答:
上面的回答都很专业,不过我觉得题主主要是要理清标定、识别、测量之间逻辑。请跟着我的思路,可能在某一步就能豁然开朗了。我尽可能避免理论和公式,希望能用尽可能通俗的话解释。
我们从单目视觉说起。平时我们都说要做视觉识别、测量云云,然后我们就会去拍照,再对数字图像做各种处理,颜色处理、灰度化、滤波、边缘检测、霍夫变换,最后得到了希望得到的特征,是这样的对吧?
不过请注意!到了这一步,其实我们仅仅是得到了一坨坨感兴趣的像素而已!究竟要怎样才能把这些像素转化到现实世界的对象中呢?也就是说,究竟要怎样对这些仅存在于图像中的东西进行测量,才能得到具有实际意义和尺度的数据呢?这个时候我们就懵逼了……
没错, 摄像机标定的存在意义就是解决这个蛋疼的问题!!!
我们继续看看,通过摄像机标定我们可以知道些什么:
1.外参数矩阵。告诉你现实世界点(世界坐标)是怎样经过旋转和平移,然后落到另一个现实世界点(摄像机坐标)上。
2.内参数矩阵。告诉你上述那个点在1的基础上,是如何继续经过摄像机的镜头、并通过针孔成像和电子转化而成为像素点的。
3.畸变矩阵。告诉你为什么上面那个像素点并没有落在理论计算该落在的位置上,还tm产生了一定的偏移和变形!!!
好了,到这里是不是明白了一点?上述3点的每一个转换,都有已经有成熟的数学描述,通过计算,我们完全可以精确地重现现实世界的任意一个点到其数字图像上对应像素点的投影过程。
对于双目视觉系统,通过立体标定还能进一步得到下面的参数:
4.结构参数。告诉你右摄像机是怎样相对于左摄像机经过旋转和平移达到现在的位置。
通过结构参数,便能把左右摄像机获取的图像的每一个像素点之间的关系用数学语言定量描述,保证两个相机都处于我们“可求”的状态。
总的来说,摄像机标定是通过寻找对象在图像与现实世界的转换数学关系,找出其定量的联系,从而实现从图像中测量出实际数据的目的。
当然,其实上述的各个转换过程大部分都不需要用户自己一个个写程序实现,比如opencv就集成了单目标定函数calibracamera()、畸变校正函数undistortinitialmap()、双目标定函数stereocalibrate()……
其实自己亲自走一遍流程就很容易领会到整个视觉测量的逻辑。比如说,在畸变校正中需要用到单目标定的畸变参数输出和内参数输出,在双目标定中需要用到单目标定的外参数输出,在外极线校准中需要用到双目标定的结构参数输出,在立体匹配中中需要用到外极线校准的输出参数,在三维反求中需要用到立体匹配的输出参数。用户自己走完一遍这个流程,基本上就发现没有做标定的话,几乎什么都干不了。
这篇关于摄像机标定学习笔记(4)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!