本文主要是介绍基于python的OpenCV快速入门——几何变换,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
基于python的OpenCV快速入门——几何变换
1、缩放
- 在OpenCV中,使用函数cv2.resize()实现对图像的缩放
- 语法格式为
dst = cv2.resize( src, dsize[ ,fx[, fy[ ,interpolation]]])
- dst代表输出目标图像,该图像的类型与src相同,大小为dsize
- src代表需要缩放的原始图像
- dsize表示输出图像大小
- fx代表水平方向的缩放比例
- fy代表竖直方向的缩放比例
- interpolation代表插值方式,具体如表
在cv2.resize()函数中,目标图像大小既可以由dsize来表示,也可以由参数fx和fy表示
情况一:
- 如果指定参数dsize,则只靠dsize来决定目标图像大小
- 需要注意的是dsize内的第一个参数对应缩放后图像的宽度(width,即参数cols,与参数fx相关),第2个参数对应缩放后图像的高度(height,即行数rows,与参数fy相关)
- 指定参数dsize的值时,x方向的缩放大小(参数fx)为:
(double)dsize.width/src.cols
- 同时,y方向的缩放大小(参数fy)为:
(double)dsize.height/src.rows
情况二
如果参数dsize的值是None,那么目标图像的大小通过参数fx和fy来决定。
dsize = Size(round(fx*src.cols),round(fy*src.row))
2、翻转
- 在OpenCV中,图像的反转采用函数cv2.flip()实现
- 语法结构为
dst = cv2.flip(src , flipCode)
- dst代表和原始图像具有相同大小类型的目标图像
- src代表要处理的原始图像
- flipCode代表旋转类型。该参数意义如图:
3、仿射
-
仿射变换是指图像可以通过一系列的几何变换来实现平移、旋转等多种操作。
-
OpenCV中的仿射函数为cv2.warpAffine(),其通过一个变换矩阵(映射矩阵)M实现变换,具体为
- dst(x, y)=src(M11x+M12y+M13, M21x+M22y+M23)
-
函数语法格式为:
-
dst = cv2.warpAffine( src, M, dsize [,flags[ ,borderMode[ ,bordeValue]]])
-
- dst代表仿射后输出的图像,图像类型与原图像相同
- dsize决定输出的大小
- src代表要仿射的原图像
- M代表一个2x3的变换矩阵。使用不同矩阵就可以实现不同的变换。
- flags代表插值方式,默认为INTER_LINEAR。当该值是WARP_INVERSE_MAP时,意味着M是逆变换类型,实现从目标图像srt逆变换类型,实现从目标图像dst到原始图像src的逆变换。
- borderMode代表类型,默认为BORDER_CONSTANT。当该值为BORDER_TRANSPARENT时,意味着目标图像内的值不做改变,这些值对应原始图像内的异常值。
- borderValue代表边界值,默认为0.
该函数忽略其可选参数后的语法格式为:
dst = cv2.warpAffine( src, M ,dsize)
故其只与M有关,现在介绍通过不同的M实现不同的仿射矩阵转换
3.1平移
通过转换矩阵M实现将原始图像src转换为目标图像dst:
dst(x, y)=src(M11x+M12y+M13, M21x+M22y+M23)
将原始图像src向右侧移动100个像素、向下方移动200个像素,则其对应关系为:
dst (x, y)=src (x+ 100, y+ 200)
将上述表达式补充完整,即:
dst (x, y)=src (1·x+ 0·y+ 100, 0·x+ 1·y+ 200)
根据上述表达式,可以确定对应的转换矩阵M中各个元素的值为:
- M11=1
- M12=0
- M13=100
- M21=0
- M22=1
- M23=200
将上述值代入转换矩阵M,得到:
具体代码为:
import cv2
import numpy as np
img = cv2.imread("Third.jpg")
height ,width = img.shape[:2]
x=100
y=200
M = np.float32([[1 , 0 ,x],[0 ,1 ,y]])
move = cv2.warpAffine(img , M ,(width,height))
cv2.imshow("original",img)
cv2.imshow("move",move)
cv2.waitKey()
cv2.destroyAllWindows()
3.2旋转
-
可以通过cv2.getRotationMatrix2D()来获取旋转矩阵。
-
该函数的语法格式为:
-
retavl = cv2.getRotationMatrix2D(center , angle , scale)
- center为旋转中心
- angle为旋转角度,正数表示逆时针旋转,负数表示顺时针旋转
- scale为变换尺寸(缩放大小)
3.3更复杂的仿射变换
-
OpenCV提供了函数cv2.getAffineTransform()来生成仿射函数cv2.warpAffine()所使用的转换矩阵M。
-
该函数的语法格式为:
-
retval = cv2.getAffineTransform(src ,dst)
- src代表输入图像的三个点坐标
- dst代表输出图像的三个点坐标
4、透视
第三节所讲的仿射变换可以将矩形映射为任意平行四边形,透视变换则可以将矩形映射为任意四边形。
- 透视变换通过函数cv2.warpPerspective()实现
- 该函数的语法是:
dst = cv2.warpPerspective( src, M, dsize[, flags[, borderMode[, borderValue]]] )
- dst代表透视处理后的输出图像,该图像和原始图像具有相同的类型。dsize决定输出图像的实际大小。
- src代表要透视的图像。
- M代表一个3×3的变换矩阵。
- dsize代表输出图像的尺寸大小。
- flags代表插值方法,默认为INTER_LINEAR。当该值为WARP_INVERSE_MAP时,意味着M是逆变换类型,能实现从目标图像dst到原始图像src的逆变换。
- borderMode代表边类型,默认为BORDER_CONSTANT。当该值为BORDER_TRANSPARENT时,意味着目标图像内的值不做改变,这些值对应原始图像内的异常值。
- borderValue代表边界值,默认是0。
与仿射变换一样,同样可以使用一个函数来生成函数cv2.warpPerspective()所使用的转换矩阵。该函数是cv2.getPerspectiveTransform(),其语法格式为:
retval = cv2.getPerspectiveTransform( src, dst )
- src代表输入图像的四个顶点的坐标。
- dst代表输出图像的四个顶点的坐标。
- 需要注意的是,src参数和dst参数是包含四个点的数组,与仿射变换函数cv2.getAffineTransform()中的三个点是不同的。实际使用中,我们可以根据需要控制src中的四个点映射到dst中的四个点。
这篇关于基于python的OpenCV快速入门——几何变换的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!