SIFT特征检测

2024-08-31 21:48
文章标签 检测 特征 sift

本文主要是介绍SIFT特征检测,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

作为在CV界叱咤风云多年的SIFT,David Lowe1999年提出来,2005年完善发表在IJCV上。至今已经作为一道丰碑屹立CV界十年不倒,不可谓不震古烁今。作为最经典的高效斑点检测算子之一,对于学习局部特征的我来说,研读必要性不言而喻。这篇文章,将主要介绍SIFT特征提取的过程,当然网上已经有了各种介绍SIFT的博文,其中很多准确的分析给了我很大的指导。太多就不一一列举,不过推荐大家关注一下http://blog.csdn.net/abcjennifer/article/details/7639681这篇博文的作者,确实是大神啊,CV,机器学习等各种涉猎甚至精通,确实给我这种小白很大的启发。闲话就讲这些,下面开始正题,本文不是完整介绍SIFT特征检测,主要是分析一下我在研读SIFT时遇到的问题,以及一些想法。完整介绍网上已经有太多,大家可以自己搜索。
SIFT原文:http://www.cs.ubc.ca/~lowe/papers/ijcv04.pdf


SIFT的创新点:

  1. 首先我们得知道,SIFT是一种局部特征解决方案。虽然我们总在说SIFT,但是你得意识到SIFT是一种将特征点检测,特征点描述,特征点匹配,经过程序优化,FPGA加速等手段,可以达到实时运行的解决方案。
  2. 然后,SIFT是一种斑点检测的算子(具体什么是斑点,参看http://blog.csdn.net/u013207865/article/details/48542539)。斑点检测比较早期且经典的就是LOG和DOH,其实LOG和DOH的原理是很相似的,都是基于高斯函数的二阶微分,区别在于响应函数,LOG的响应函数是规范化的拉普拉斯响应,DOH的响应函数是图像的二阶微分矩阵。所以LOG和DOH,都涉及到卷积核在两个方向的一阶和二阶微分,比较费时。SIFT提出了对LOG的近似算法,DOG。

DOG原理:

尺度空间(http://blog.csdn.net/u013207865/article/details/48518637这篇文章有介绍,尺度空间表达式利用的是原始图像与高斯核函数卷积得到)。LOG利用的是规范化的拉普拉斯函数,表达式是
这里写图片描述
但是参考热传导方程:
这里写图片描述
故可以得到下式:
这里写图片描述
也就是拉普拉斯表达式变为了核函数关于尺度的导数,而核函数关于尺度导数可以利用有限差分:
这里写图片描述
进而可得:
这里写图片描述
上式左边就是DOG的基本公式,右边就是LOG的基本公式,这样就完成了DOG对LOG的近似。
利用DOG对LOG进行近似,主要优势:

  1. 计算量小,毕竟DOG直接利用高斯卷积核,不需要像LOG在两个方向进行高斯二阶微分卷积核计算
  2. DOG保留了各个高斯尺度空间的图像(图像金字塔),这样为后续描述向量的生成提供了数据
  3. DOG是LOG的近似,所以继承了LOG的优点,抗噪能力强,稳定性好。

高斯差分金字塔的生成:

这个是SIFT比较经典的,虽然高斯金字塔很早就有,但是SIFT对其的运用确实精彩。SIFT是基于高斯金字塔,生成差分金字塔。生成步骤如下:

  1. 高斯金字塔有两个概念,组(octave,后面简称o)和层(level,后面简称s)。David Lowe论文中,给出的是o=3,s=3。
    这里写图片描述
    这里需要说明,s=3不是说,在建立高斯金字塔的时候每组只有3层,一般建立高斯金字塔时,每组有s+3层,进而生成的差分金字塔有s+2层,然后特征检测需要剔除上下最外面两层,就只剩下s层了,这个概念是我以前总是迷糊的。

  2. 第二个就是o的第一组设置,分为0和-1两种。当为0时,正如上图所示,输入的就是原图,输入原图时需要进行 σn=0.5 的高斯模糊,然后再以此为基础进行高斯金字塔的建立;当为-1时,对原图像先进行一个双线性插值放大一倍,然后再进行 σn=1 的高斯模糊,紧接着进行高斯金字塔的建立。总结一下:两者的区别在于,是否对原图像进行放大。

  3. σ0 称之为基准层的尺度,然后每组每层的尺度计算,利用的是下式
    这里写图片描述
    其中 omin=1 s{0,...,S+1} 图中有误。

  4. 每组的第一张图片是上一组的倒数第三章图片降采样得到的,这样做的目的是为了保证尺度空间的连续性。什么叫尺度空间的连续性?比如 {σ,kσ,k2σ.....knσ} 这样的尺度空间就是连续的,如果尺度空间是 {σ,kσ,kσ.....kmσ} ,那么就是不连续的。具体可以参看下面这张图,就知道为什么需要选取倒数第三张图进行降采样了。
    这里写图片描述
    红色框中就是最终建立的差分尺度空间,可以发现从左到右,其尺度是连续的。

点的搜索、定位以及删除边缘效应

这个其实认真看一下,很好理解,也就没什么需要特别说明的了。简单说一下:很显然,我们得到的特征点坐标是像素级别的,但是在一些更加精密的实验中,像素级别的特征点是不能满足要求的,因而需要对特征点进行精确定位到亚像素级别,这就是特征点定位完成的任务。

删除边缘效应,可以参考Harris角点检测(http://blog.csdn.net/u013207865/article/details/48572957)。这里主要是设置两个特征值的比值 λ>1 λ 也叫主曲率比值David Lowe设置的是10.

PS :给大家推荐一个很强大,简单的库,VLFeat,里面有CV和ML的各种基本算法的实现。

这篇关于SIFT特征检测的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1125080

相关文章

综合安防管理平台LntonAIServer视频监控汇聚抖动检测算法优势

LntonAIServer视频质量诊断功能中的抖动检测是一个专门针对视频稳定性进行分析的功能。抖动通常是指视频帧之间的不必要运动,这种运动可能是由于摄像机的移动、传输中的错误或编解码问题导致的。抖动检测对于确保视频内容的平滑性和观看体验至关重要。 优势 1. 提高图像质量 - 清晰度提升:减少抖动,提高图像的清晰度和细节表现力,使得监控画面更加真实可信。 - 细节增强:在低光条件下,抖

烟火目标检测数据集 7800张 烟火检测 带标注 voc yolo

一个包含7800张带标注图像的数据集,专门用于烟火目标检测,是一个非常有价值的资源,尤其对于那些致力于公共安全、事件管理和烟花表演监控等领域的人士而言。下面是对此数据集的一个详细介绍: 数据集名称:烟火目标检测数据集 数据集规模: 图片数量:7800张类别:主要包含烟火类目标,可能还包括其他相关类别,如烟火发射装置、背景等。格式:图像文件通常为JPEG或PNG格式;标注文件可能为X

基于 YOLOv5 的积水检测系统:打造高效智能的智慧城市应用

在城市发展中,积水问题日益严重,特别是在大雨过后,积水往往会影响交通甚至威胁人们的安全。通过现代计算机视觉技术,我们能够智能化地检测和识别积水区域,减少潜在危险。本文将介绍如何使用 YOLOv5 和 PyQt5 搭建一个积水检测系统,结合深度学习和直观的图形界面,为用户提供高效的解决方案。 源码地址: PyQt5+YoloV5 实现积水检测系统 预览: 项目背景

JavaFX应用更新检测功能(在线自动更新方案)

JavaFX开发的桌面应用属于C端,一般来说需要版本检测和自动更新功能,这里记录一下一种版本检测和自动更新的方法。 1. 整体方案 JavaFX.应用版本检测、自动更新主要涉及一下步骤: 读取本地应用版本拉取远程版本并比较两个版本如果需要升级,那么拉取更新历史弹出升级控制窗口用户选择升级时,拉取升级包解压,重启应用用户选择忽略时,本地版本标志为忽略版本用户选择取消时,隐藏升级控制窗口 2.

OmniGlue论文详解(特征匹配)

OmniGlue论文详解(特征匹配) 摘要1. 引言2. 相关工作2.1. 广义局部特征匹配2.2. 稀疏可学习匹配2.3. 半稠密可学习匹配2.4. 与其他图像表示匹配 3. OmniGlue3.1. 模型概述3.2. OmniGlue 细节3.2.1. 特征提取3.2.2. 利用DINOv2构建图形。3.2.3. 信息传播与新的指导3.2.4. 匹配层和损失函数3.2.5. 与Super

[数据集][目标检测]血细胞检测数据集VOC+YOLO格式2757张4类别

数据集格式:Pascal VOC格式+YOLO格式(不包含分割路径的txt文件,仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件) 图片数量(jpg文件个数):2757 标注数量(xml文件个数):2757 标注数量(txt文件个数):2757 标注类别数:4 标注类别名称:["Platelets","RBC","WBC","sickle cell"] 每个类别标注的框数:

Temu官方宣导务必将所有的点位材料进行检测-RSL资质检测

关于饰品类产品合规问题宣导: 产品法规RSL要求 RSL测试是根据REACH法规及附录17的要求进行测试。REACH法规是欧洲一项重要的法规,其中包含许多对化学物质进行限制的规定和高度关注物质。 为了确保珠宝首饰的安全性,欧盟REACH法规规定,珠宝首饰上架各大电商平台前必须进行RSLReport(欧盟禁限用化学物质检测报告)资质认证,以确保产品不含对人体有害的化学物质。 RSL-铅,

《计算机视觉工程师养成计划》 ·数字图像处理·数字图像处理特征·概述~

1 定义         从哲学角度看:特征是从事物当中抽象出来用于区别其他类别事物的属性集合,图像特征则是从图像中抽取出来用于区别其他类别图像的属性集合。         从获取方式看:图像特征是通过对图像进行测量或借助算法计算得到的一组表达特性集合的向量。 2 认识         有些特征是视觉直观感受到的自然特征,例如亮度、边缘轮廓、纹理、色彩等。         有些特征需要通

YOLOv8/v10+DeepSORT多目标车辆跟踪(车辆检测/跟踪/车辆计数/测速/禁停区域/绘制进出线/绘制禁停区域/车道车辆统计)

01:YOLOv8 + DeepSort 车辆跟踪 该项目利用YOLOv8作为目标检测模型,DeepSort用于多目标跟踪。YOLOv8负责从视频帧中检测出车辆的位置,而DeepSort则负责关联这些检测结果,从而实现车辆的持续跟踪。这种组合使得系统能够在视频流中准确地识别并跟随特定车辆。 02:YOLOv8 + DeepSort 车辆跟踪 + 任意绘制进出线 在此基础上增加了用户

独立按键单击检测(延时消抖+定时器扫描)

目录 独立按键简介 按键抖动 模块接线 延时消抖 Key.h Key.c 定时器扫描按键代码 Key.h Key.c main.c 思考  MultiButton按键驱动 独立按键简介 ​ 轻触按键相当于一种电子开关,按下时开关接通,松开时开关断开,实现原理是通过轻触按键内部的金属弹片受力弹动来实现接通与断开。  ​ 按键抖动 由于按键内部使用的是机