计算机视觉 | 基于 ORB 特征检测器和描述符的全景图像拼接算法

本文主要是介绍计算机视觉 | 基于 ORB 特征检测器和描述符的全景图像拼接算法,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

Hi,大家好,我是半亩花海。本项目实现了基于 ORB 特征检测器描述符的全景图像拼接算法,能够将两张部分重叠的图像拼接成一张无缝连接的全景图像。

文章目录

  • 一、随机抽样一致算法
  • 二、功能实现
  • 三、代码解析
  • 四、效果展示
  • 五、完整代码

一、随机抽样一致算法

我们可以通过求取上一张中的特征点匹配的方法,将多个图片拼接在一起。简单来说就是将这张图片做一个变换到另外一个图片上面去,中间就是一个变换矩阵。

随机抽样一致算法(Random sample consensus,RANSAC):

由于局外点、异常点的干扰,最小二乘拟合的效果容易走偏,而随机抽样一致算法中的数据点更不容易走偏,拟合的效果更好。

选择初始样本点进行拟合,给定一个容忍范围,不断进行迭代

随机算两个点,看落在区间内的点有多少个,越多越好。

每一次拟合后,容差范围内都有对应的数据点数,找出数据点个数最多的情况,就是最终的拟合结果:

单应性矩阵:

二、功能实现

全景图像拼接流程:

  • 提取图像特征
  • 对两张图片提取的特征点求变换矩阵
  • 变换
  • 图像拼接功能

    • 支持将两张部分重叠的图像拼接成一张全景图像。
  • 特征检测与匹配

    • 使用 ORB 特征检测器和描述符进行关键点检测和特征提取。
    • 使用 BFMatcher 进行关键点匹配。
  • 参数调整

    • 可调整拼接参数,如匹配比例和重投影误差阈值。
  • 可视化

    • 可选择是否显示关键点匹配可视化结果。

三、代码解析

  • Stitcher类

    • stitch方法: 用于执行图像拼接。
    • detectAndDescribe方法: 用于特征检测和描述。
    • matchKeypoints方法: 用于关键点匹配和透视变换计算。
    • drawMatches方法: 用于绘制关键点匹配可视化结果。
  • 使用方法

    • 准备两张待拼接的部分重叠图像。
    • 调用 Stitcher 类的 stitch 方法,传入待拼接图像。
    • 根据需要选择是否显示关键点匹配可视化结果。
    • 获取拼接后的全景图像。

四、效果展示

两张原图:

关键点匹配:

拼接结果:

五、完整代码

#!/usr/bin/env python
# -*- coding:utf-8 -*-
"""
@Project : Stitcher-全景图像拼接-ORB特征检测器和描述符
@File    : Stitcher.py
@IDE     : PyCharm
@Author  : 半亩花海
@Date    : 2024/04/10 11:29
"""
import numpy as np
import cv2class Stitcher:def stitch(self, images, ratio=0.75, reprojThresh=4.0, showMatches=False):  # 拼接函数# 解包输入图片(imageB, imageA) = images# 将图片转换为灰度图grayA = cv2.cvtColor(imageA, cv2.COLOR_BGR2GRAY)grayB = cv2.cvtColor(imageB, cv2.COLOR_BGR2GRAY)# 使用ORB特征检测器和描述符(kpsA, featuresA) = self.detectAndDescribe(grayA)(kpsB, featuresB) = self.detectAndDescribe(grayB)# 匹配特征点M = self.matchKeypoints(kpsA, kpsB, featuresA, featuresB, ratio, reprojThresh)# 如果匹配结果为空,则返回Noneif M is None:print("Failed to stitch images. Not enough matches.")return None# 解包匹配结果(matches, H, status) = M# 进行透视变换,拼接图像result = cv2.warpPerspective(imageA, H, (imageA.shape[1] + imageB.shape[1], imageA.shape[0]))result[0:imageB.shape[0], 0:imageB.shape[1]] = imageB# 如果需要显示匹配结果,则返回拼接图和匹配可视化图if showMatches:vis = self.drawMatches(imageA, imageB, kpsA, kpsB, matches, status)return (result, vis)# 否则,只返回拼接图return result@staticmethoddef cv_show(name, img):# 显示图像cv2.imshow(name, img)cv2.waitKey(0)cv2.destroyAllWindows()@staticmethoddef detectAndDescribe(image):# 创建ORB特征检测器orb = cv2.ORB_create()# 检测特征点并计算描述符(kps, features) = orb.detectAndCompute(image, None)kps = np.float32([kp.pt for kp in kps])return (kps, features)@staticmethoddef matchKeypoints(kpsA, kpsB, featuresA, featuresB, ratio, reprojThresh):# 创建BFMatcher对象matcher = cv2.BFMatcher()# 使用KNN匹配rawMatches = matcher.knnMatch(featuresA, featuresB, 2)# 进行筛选,获取匹配点对matches = []for m in rawMatches:if len(m) == 2 and m[0].distance < m[1].distance * ratio:matches.append((m[0].trainIdx, m[0].queryIdx))# 如果匹配点对数量大于4,则计算透视变换矩阵if len(matches) > 4:ptsA = np.float32([kpsA[i] for (_, i) in matches])ptsB = np.float32([kpsB[i] for (i, _) in matches])(H, status) = cv2.findHomography(ptsA, ptsB, cv2.RANSAC, reprojThresh)return (matches, H, status)# 否则,返回Nonereturn None@staticmethoddef drawMatches(imageA, imageB, kpsA, kpsB, matches, status):(hA, wA) = imageA.shape[:2](hB, wB) = imageB.shape[:2]vis = np.zeros((max(hA, hB), wA + wB, 3), dtype="uint8")vis[0:hA, 0:wA] = imageAvis[0:hB, wA:] = imageBfor ((trainIdx, queryIdx), s) in zip(matches, status):if s == 1:ptA = (int(kpsA[queryIdx][0]), int(kpsA[queryIdx][1]))ptB = (int(kpsB[trainIdx][0]) + wA, int(kpsB[trainIdx][1]))cv2.line(vis, ptA, ptB, (0, 255, 0), 1)return visif __name__ == "__main__":# 读取拼接图片imageA = cv2.imread("left_01.png")imageB = cv2.imread("right_01.png")# 把图片拼接成全景图stitcher = Stitcher()result = stitcher.stitch([imageA, imageB], showMatches=True)if result is not None:# 解包拼接结果(panorama, matchesVis) = result# 显示拼接前的两幅图像,匹配的关键点和拼接后的图像cv2.imshow("Image A", imageA)cv2.imshow("Image B", imageB)cv2.imshow("Keypoint Matches", matchesVis)cv2.imshow("Result", panorama)cv2.waitKey(0)cv2.destroyAllWindows()

这篇关于计算机视觉 | 基于 ORB 特征检测器和描述符的全景图像拼接算法的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/893833

相关文章

SpringBoot实现MD5加盐算法的示例代码

《SpringBoot实现MD5加盐算法的示例代码》加盐算法是一种用于增强密码安全性的技术,本文主要介绍了SpringBoot实现MD5加盐算法的示例代码,文中通过示例代码介绍的非常详细,对大家的学习... 目录一、什么是加盐算法二、如何实现加盐算法2.1 加盐算法代码实现2.2 注册页面中进行密码加盐2.

Java时间轮调度算法的代码实现

《Java时间轮调度算法的代码实现》时间轮是一种高效的定时调度算法,主要用于管理延时任务或周期性任务,它通过一个环形数组(时间轮)和指针来实现,将大量定时任务分摊到固定的时间槽中,极大地降低了时间复杂... 目录1、简述2、时间轮的原理3. 时间轮的实现步骤3.1 定义时间槽3.2 定义时间轮3.3 使用时

python中字符串拼接的几种方法及优缺点对比详解

《python中字符串拼接的几种方法及优缺点对比详解》在Python中,字符串拼接是常见的操作,Python提供了多种方法来拼接字符串,每种方法有其优缺点和适用场景,以下是几种常见的字符串拼接方法,需... 目录1. 使用 + 运算符示例:优缺点:2. 使用&nbsjsp;join() 方法示例:优缺点:3

Golang中拼接字符串的6种方式性能对比

《Golang中拼接字符串的6种方式性能对比》golang的string类型是不可修改的,对于拼接字符串来说,本质上还是创建一个新的对象将数据放进去,主要有6种拼接方式,下面小编就来为大家详细讲讲吧... 目录拼接方式介绍性能对比测试代码测试结果源码分析golang的string类型是不可修改的,对于拼接字

如何通过Golang的container/list实现LRU缓存算法

《如何通过Golang的container/list实现LRU缓存算法》文章介绍了Go语言中container/list包实现的双向链表,并探讨了如何使用链表实现LRU缓存,LRU缓存通过维护一个双向... 目录力扣:146. LRU 缓存主要结构 List 和 Element常用方法1. 初始化链表2.

使用Python开发一个图像标注与OCR识别工具

《使用Python开发一个图像标注与OCR识别工具》:本文主要介绍一个使用Python开发的工具,允许用户在图像上进行矩形标注,使用OCR对标注区域进行文本识别,并将结果保存为Excel文件,感兴... 目录项目简介1. 图像加载与显示2. 矩形标注3. OCR识别4. 标注的保存与加载5. 裁剪与重置图像

golang字符串匹配算法解读

《golang字符串匹配算法解读》文章介绍了字符串匹配算法的原理,特别是Knuth-Morris-Pratt(KMP)算法,该算法通过构建模式串的前缀表来减少匹配时的不必要的字符比较,从而提高效率,在... 目录简介KMP实现代码总结简介字符串匹配算法主要用于在一个较长的文本串中查找一个较短的字符串(称为

通俗易懂的Java常见限流算法具体实现

《通俗易懂的Java常见限流算法具体实现》:本文主要介绍Java常见限流算法具体实现的相关资料,包括漏桶算法、令牌桶算法、Nginx限流和Redis+Lua限流的实现原理和具体步骤,并比较了它们的... 目录一、漏桶算法1.漏桶算法的思想和原理2.具体实现二、令牌桶算法1.令牌桶算法流程:2.具体实现2.1

Java实战之自助进行多张图片合成拼接

《Java实战之自助进行多张图片合成拼接》在当今数字化时代,图像处理技术在各个领域都发挥着至关重要的作用,本文为大家详细介绍了如何使用Java实现多张图片合成拼接,需要的可以了解下... 目录前言一、图片合成需求描述二、图片合成设计与实现1、编程语言2、基础数据准备3、图片合成流程4、图片合成实现三、总结前

基于WinForm+Halcon实现图像缩放与交互功能

《基于WinForm+Halcon实现图像缩放与交互功能》本文主要讲述在WinForm中结合Halcon实现图像缩放、平移及实时显示灰度值等交互功能,包括初始化窗口的不同方式,以及通过特定事件添加相应... 目录前言初始化窗口添加图像缩放功能添加图像平移功能添加实时显示灰度值功能示例代码总结最后前言本文将