本文主要是介绍LK光流法和LK金字塔光流法(含python和c++代码示例),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
0 引言
本文主要记录LK
光流算法及LK
金字塔光流算法的详细原理,最后还调用OpenCV
中的cv2.calcOpticalFlowPyrLK()
函数实现LK
金字塔光流算法,其中第3
部分是python
语言实现版本,第4
部分是c++
语言实现版本。
1 LK光流算法
1.1 简述
LK
光流法是一种计算图像序列中物体运动的光流(optical flow
)的经典算法。它是由Bruce D. Lucas
和Takeo Kanade
在1981
年提出的,被广泛应用于计算机视觉和图像处理领域。
光流是指图像中物体在时间上的运动造成的像素强度变化。光流法的目标是通过分析图像序列中相邻帧之间的像素强度变化来估计物体的运动状况。LK
光流法基于以下三个基本假设:
- 亮度恒定假设:假设相邻帧中的像素在时间上的变化主要由物体的运动引起,而不是由光照变化或物体的颜色变化引起。这意味着在物体的运动下,相邻帧中对应的像素强度值应该保持不变;
- 小运动假设:假设物体在相邻帧之间的运动是较小的,即相邻帧之间的像素位移较小。这个假设使得可以使用局部近似的方法来估计光流;
- 空间一致性:场景中相同表面的相邻点具有相似的运动,并且其投影到图像平面上的距离也比较近。(
LK
算法特有)
1.2 原理推导
首先基于亮度恒定假设和小运动假设,设 t t t时刻,位于 ( x , y ) (x,y) (x,y)像素位置的物体,且在 t + Δ t t+\Delta _t t+Δt时刻位于 ( x + u , y + v ) (x+u,y+v) (x+u,y+v)位置,则有:
I ( x , y , t ) = I ( x + u , y + v , t + Δ t ) (1) I(x,y,t)=I(x+u,y+v,t+\Delta _t) \tag{1} I(x,y,t)=I(x+u,y+v,t+Δt)(1)
将等式右边进行一阶泰勒展开得:
I ( x + u , y + v , t + Δ t ) = I ( x , y , t ) + I x ′ u + I y ′ v + I t ′ Δ t (2) I(x+u,y+v,t+\Delta _t)=I(x,y,t)+I{}'_xu+I{}'_yv+I{}'_t\Delta _t \tag{2} I(x+u,y+v,t+Δt)=I(x,y,t)+Ix′u+Iy′v+It′Δt(2)
结合公式1
和公式2
,得出:
I ( x , y , t ) = I ( x , y , t ) + I x ′ u + I y ′ v + I t ′ Δ t (3) I(x,y,t)=I(x,y,t)+I{}'_xu+I{}'_yv+I{}'_t\Delta _t \tag{3} I(x,y,t)=I(x,y,t)+Ix′u+Iy′v+It′Δt(3)
即:
I x ′ u + I y ′ v + I t ′ Δ t = 0 (4) I{}'_xu+I{}'_yv+I{}'_t\Delta _t=0 \tag{4} Ix′u+Iy′v+It′Δt=0(4)
公式4
写成矩阵形式:
[ I x ′ + I y ′ ] [ u v ] = − I t ′ Δ t = − Δ I t (5) \begin{bmatrix}I{}'_x+I{}'_y\end{bmatrix}\begin{bmatrix}u \\ v\end{bmatrix}=-I{}'_t\Delta _t=-\Delta I_t \tag{5} [Ix′+Iy′][uv]=−It′Δt=−ΔIt(5)
其中, I x ′ , I y ′ I{}'_x,I{}'_y Ix′,Iy′分别为 ( x , y ) (x,y) (x,y)像素点处图像亮度在 x x x方向和 y y y方向的偏导数;
I t ′ I{}'_t It′为 t t t时刻, ( x , y ) (x,y) (x,y)处像素亮度对时间的导数;
I t ′ Δ t I{}'_t\Delta _t It′Δt为两图之间的 ( x , y ) (x,y) (x,y)坐标位置的亮度差,表示为 Δ I t = I t ′ Δ t \Delta I_t=I{}'_t\Delta _t ΔIt=It′Δt
给定两张图片, I x ′ , I y ′ , Δ I t I{}'_x,I{}'_y,\Delta I_t Ix′,Iy′,ΔIt是已知量, u , v u,v u,v即是待求的光流,但仅凭公式5
一个等式求解两个未知数 u , v u,v u,v,暂时无法得到唯一解。
所以还需借助第三个假设-空间一致性,假设在一个大小为 m × m ( n = m 2 ) m\times m(n=m^2) m×m(n=m2)的窗口内,图像的光流是一个恒定值,可得:
I x 1 u + I y 1 v = − I t 1 I x 2 u + I y 2 v = − I t 2 ⋯ I x n u + I y n v = − I t n (6) \begin{gather} I_{x1}u+I_{y1}v=-I_{t1} \\ I_{x2}u+I_{y2}v=-I_{t2} \\ \cdots \\ I_{xn}u+I_{yn}v=-I_{tn} \\ \end{gather} \tag{6} Ix1u+Iy1v=−It1Ix2u+Iy2v=−It2⋯Ixnu+Iynv=−Itn(6)
用矩阵形式表示为:
[ I x 1 + I y 1 I x 2 + I y 2 ⋮ I x n + I y n ] [ u v ] = [
这篇关于LK光流法和LK金字塔光流法(含python和c++代码示例)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!