【OpenCV】SIFT原理与源码

2024-06-18 22:48
文章标签 源码 opencv 原理 sift

本文主要是介绍【OpenCV】SIFT原理与源码,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

SIFT简介

Scale Invariant Feature Transform,尺度不变特征变换匹配算法,是由David G. Lowe在1999年(《Object Recognition from Local Scale-Invariant Features》)提出的高效区域检测算法,在2004年(《Distinctive Image Features from Scale-Invariant Keypoints》)得以完善。

SIFT特征对旋转、尺度缩放、亮度变化等保持不变性,是非常稳定的局部特征,现在应用很广泛。而SIFT算法是将Blob检测,特征矢量生成,特征匹配搜索等步骤结合在一起优化。我会更新一系列文章,分析SIFT算法原理及OpenCV 2.4.2实现的SIFT源码:

  1. DoG尺度空间构造(Scale-space extrema detection
  2. 关键点搜索与定位(Keypoint localization
  3. 方向赋值(Orientation assignment
  4. 关键点描述(Keypoint descriptor
  5. OpenCV实现:特征检测器FeatureDetector
  6. SIFT中LoG和DoG的比较
OpenCV2.3之后实现了SIFT的代码,2.4改掉了一些bug。本系列文章主要分析OpenCV 2.4.2SIFT函数源码。
SIFT位于OpenCV nonfree的模块, David G. Lowe申请了算法的版权,请尊重作者权力,务必在允许范围内使用。

SIFT in OpenCV

OpenCV中的SIFT函数主要有两个接口。

构造函数:

[cpp]  view plain copy 在CODE上查看代码片 派生到我的代码片
  1. SIFT::SIFT(int nfeatures=0, int nOctaveLayers=3, double contrastThreshold=0.04, double edgeThreshold=  
  2. 10, double sigma=1.6)  
nfeatures:特征点数目(算法对检测出的特征点排名,返回最好的nfeatures个特征点)。
nOctaveLayers:金字塔中每组的层数(算法中会自己计算这个值,后面会介绍)。
contrastThreshold:过滤掉较差的特征点的对阈值。contrastThreshold越大,返回的特征点越少。
edgeThreshold:过滤掉边缘效应的阈值。edgeThreshold越大,特征点越多(被多滤掉的越少)。
sigma:金字塔第0层图像高斯滤波系数,也就是σ。

重载操作符:

[cpp]  view plain copy 在CODE上查看代码片 派生到我的代码片
  1. void SIFT::operator()(InputArray img, InputArray mask, vector<KeyPoint>& keypoints, OutputArray  
  2. descriptors, bool useProvidedKeypoints=false)  

img:8bit灰度图像
mask:图像检测区域(可选)
keypoints:特征向量矩阵
descipotors:特征点描述的输出向量(如果不需要输出,需要传cv::noArray())。
useProvidedKeypoints:是否进行特征点检测。ture,则检测特征点;false,只计算图像特征描述。

函数源码

构造函数SIFT()主要用来初始化参数,并没有特定的操作:
[cpp]  view plain copy 在CODE上查看代码片 派生到我的代码片
  1. SIFT::SIFT( int _nfeatures, int _nOctaveLayers,  
  2.            double _contrastThreshold, double _edgeThreshold, double _sigma )  
  3.     : nfeatures(_nfeatures), nOctaveLayers(_nOctaveLayers),  
  4.     contrastThreshold(_contrastThreshold), edgeThreshold(_edgeThreshold), sigma(_sigma)  
  5.     // sigma:对第0层进行高斯模糊的尺度空间因子。  
  6.     // 默认为1.6(如果是软镜摄像头捕获的图像,可以适当减小此值)  
  7. {  
  8. }  

主要操作还是利用重载操作符()来执行:
[cpp]  view plain copy 在CODE上查看代码片 派生到我的代码片
  1. void SIFT::operator()(InputArray _image, InputArray _mask,  
  2.                       vector<KeyPoint>& keypoints,  
  3.                       OutputArray _descriptors,  
  4.                       bool useProvidedKeypoints) const  
  5. // mask :Optional input mask that marks the regions where we should detect features.  
  6. // Boolean flag. If it is true, the keypoint detector is not run. Instead,  
  7. // the provided vector of keypoints is used and the algorithm just computes their descriptors.  
  8. // descriptors – The output matrix of descriptors.  
  9. // Pass cv::noArray() if you do not need them.              
  10. {  
  11.     Mat image = _image.getMat(), mask = _mask.getMat();  
  12.   
  13.     if( image.empty() || image.depth() != CV_8U )  
  14.         CV_Error( CV_StsBadArg, "image is empty or has incorrect depth (!=CV_8U)" );  
  15.   
  16.     if( !mask.empty() && mask.type() != CV_8UC1 )  
  17.         CV_Error( CV_StsBadArg, "mask has incorrect type (!=CV_8UC1)" );  
  18.   
  19.           
  20.     // 得到第1组(Octave)图像  
  21.     Mat base = createInitialImage(image, false, (float)sigma);  
  22.     vector<Mat> gpyr, dogpyr;  
  23.     // 每层金字塔图像的组数(Octave)  
  24.     int nOctaves = cvRound(log( (double)std::min( base.cols, base.rows ) ) / log(2.) - 2);  
  25.   
  26.     // double t, tf = getTickFrequency();  
  27.     // t = (double)getTickCount();  
  28.       
  29.     // 构建金字塔(金字塔层数和组数相等)  
  30.     buildGaussianPyramid(base, gpyr, nOctaves);  
  31.     // 构建高斯差分金字塔  
  32.     buildDoGPyramid(gpyr, dogpyr);  
  33.   
  34.     //t = (double)getTickCount() - t;  
  35.     //printf("pyramid construction time: %g\n", t*1000./tf);  
  36.       
  37.     // useProvidedKeypoints默认为false  
  38.     // 使用keypoints并计算特征点的描述符  
  39.     if( !useProvidedKeypoints )  
  40.     {  
  41.         //t = (double)getTickCount();  
  42.         findScaleSpaceExtrema(gpyr, dogpyr, keypoints);  
  43.         //除去重复特征点  
  44.         KeyPointsFilter::removeDuplicated( keypoints );   
  45.   
  46.         // mask标记检测区域(可选)  
  47.         if( !mask.empty() )  
  48.             KeyPointsFilter::runByPixelsMask( keypoints, mask );  
  49.   
  50.         // retainBest:根据相应保留指定数目的特征点(features2d.hpp)  
  51.         if( nfeatures > 0 )  
  52.             KeyPointsFilter::retainBest(keypoints, nfeatures);  
  53.         //t = (double)getTickCount() - t;  
  54.         //printf("keypoint detection time: %g\n", t*1000./tf);  
  55.     }  
  56.     else  
  57.     {  
  58.         // filter keypoints by mask  
  59.         // KeyPointsFilter::runByPixelsMask( keypoints, mask );  
  60.     }  
  61.   
  62.     // 特征点输出数组  
  63.     if( _descriptors.needed() )  
  64.     {  
  65.         //t = (double)getTickCount();  
  66.         int dsize = descriptorSize();  
  67.         _descriptors.create((int)keypoints.size(), dsize, CV_32F);  
  68.         Mat descriptors = _descriptors.getMat();  
  69.   
  70.         calcDescriptors(gpyr, keypoints, descriptors, nOctaveLayers);  
  71.         //t = (double)getTickCount() - t;  
  72.         //printf("descriptor extraction time: %g\n", t*1000./tf);  
  73.     }  
  74. }  

函数中用到的构造金字塔: buildGaussianPyramid(base, gpyr, nOctaves);等步骤请参见文章后续系列。



这篇关于【OpenCV】SIFT原理与源码的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1073274

相关文章

opencv图像处理之指纹验证的实现

《opencv图像处理之指纹验证的实现》本文主要介绍了opencv图像处理之指纹验证的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学... 目录一、简介二、具体案例实现1. 图像显示函数2. 指纹验证函数3. 主函数4、运行结果三、总结一、

Python中随机休眠技术原理与应用详解

《Python中随机休眠技术原理与应用详解》在编程中,让程序暂停执行特定时间是常见需求,当需要引入不确定性时,随机休眠就成为关键技巧,下面我们就来看看Python中随机休眠技术的具体实现与应用吧... 目录引言一、实现原理与基础方法1.1 核心函数解析1.2 基础实现模板1.3 整数版实现二、典型应用场景2

Python实现无痛修改第三方库源码的方法详解

《Python实现无痛修改第三方库源码的方法详解》很多时候,我们下载的第三方库是不会有需求不满足的情况,但也有极少的情况,第三方库没有兼顾到需求,本文将介绍几个修改源码的操作,大家可以根据需求进行选择... 目录需求不符合模拟示例 1. 修改源文件2. 继承修改3. 猴子补丁4. 追踪局部变量需求不符合很

Java的IO模型、Netty原理解析

《Java的IO模型、Netty原理解析》Java的I/O是以流的方式进行数据输入输出的,Java的类库涉及很多领域的IO内容:标准的输入输出,文件的操作、网络上的数据传输流、字符串流、对象流等,这篇... 目录1.什么是IO2.同步与异步、阻塞与非阻塞3.三种IO模型BIO(blocking I/O)NI

python+opencv处理颜色之将目标颜色转换实例代码

《python+opencv处理颜色之将目标颜色转换实例代码》OpenCV是一个的跨平台计算机视觉库,可以运行在Linux、Windows和MacOS操作系统上,:本文主要介绍python+ope... 目录下面是代码+ 效果 + 解释转HSV: 关于颜色总是要转HSV的掩膜再标注总结 目标:将红色的部分滤

Spring 中 BeanFactoryPostProcessor 的作用和示例源码分析

《Spring中BeanFactoryPostProcessor的作用和示例源码分析》Spring的BeanFactoryPostProcessor是容器初始化的扩展接口,允许在Bean实例化前... 目录一、概览1. 核心定位2. 核心功能详解3. 关键特性二、Spring 内置的 BeanFactory

JAVA封装多线程实现的方式及原理

《JAVA封装多线程实现的方式及原理》:本文主要介绍Java中封装多线程的原理和常见方式,通过封装可以简化多线程的使用,提高安全性,并增强代码的可维护性和可扩展性,需要的朋友可以参考下... 目录前言一、封装的目标二、常见的封装方式及原理总结前言在 Java 中,封装多线程的原理主要围绕着将多线程相关的操

kotlin中的模块化结构组件及工作原理

《kotlin中的模块化结构组件及工作原理》本文介绍了Kotlin中模块化结构组件,包括ViewModel、LiveData、Room和Navigation的工作原理和基础使用,本文通过实例代码给大家... 目录ViewModel 工作原理LiveData 工作原理Room 工作原理Navigation 工

Java的volatile和sychronized底层实现原理解析

《Java的volatile和sychronized底层实现原理解析》文章详细介绍了Java中的synchronized和volatile关键字的底层实现原理,包括字节码层面、JVM层面的实现细节,以... 目录1. 概览2. Synchronized2.1 字节码层面2.2 JVM层面2.2.1 ente

MySQL的隐式锁(Implicit Lock)原理实现

《MySQL的隐式锁(ImplicitLock)原理实现》MySQL的InnoDB存储引擎中隐式锁是一种自动管理的锁,用于保证事务在行级别操作时的数据一致性和安全性,本文主要介绍了MySQL的隐式锁... 目录1. 背景:什么是隐式锁?2. 隐式锁的工作原理3. 隐式锁的类型4. 隐式锁的实现与源代码分析4