利用SuperGlue算法实现跨尺度金字塔特征点的高效匹配(含py代码)

本文主要是介绍利用SuperGlue算法实现跨尺度金字塔特征点的高效匹配(含py代码),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

       在计算机视觉领域,特征点匹配是一个基础而关键的任务,广泛应用于图像拼接、三维重建、目标跟踪等方向。传统的特征点匹配方法通常基于相同尺度下提取的特征进行匹配,然而在实际场景中,由于成像距离、分辨率等因素的差异,待匹配图像间存在显著的尺度变化,直接利用原始尺度的特征难以获得理想的匹配效果。为了克服这一难题,构建图像金字塔并在不同层级进行特征提取和匹配成为一种行之有效的策略。本文将给出如何使用图神经网络匹配算法SuperGlue的代码,实现跨金字塔层级的特征点高效匹配,充分利用不同尺度信息,显著提升匹配的准确性和鲁棒性。

1. 文件结构

2. 具体代码 

#! /usr/bin/env python3
import cv2
import torch   # 这一句
torch.set_grad_enabled(False) # 这一句
from models.matching import Matching # 这一句
from models.utils import (frame2tensor) # 这一句
import numpy as npconfig = {'superpoint': {'nms_radius': 4,'keypoint_threshold': 0.005,'max_keypoints': -1},'superglue': {'weights': 'outdoor','sinkhorn_iterations': 20,'match_threshold': 0.2,}
}
#
# device = 'cuda' if torch.cuda.is_available() else 'cpu'
device = 'cuda'
matching = Matching(config).eval().to(device)     # 这一句
keys = ['keypoints', 'scores', 'descriptors']
######################################################################################################
def match_frames_with_super_glue(frame0,frame1):print("正在调用基于 superGlue 匹配的函数进行特征点匹配...")  # 添加了print语句# 将参考帧和当前帧转换为PyTorch张量格式frame_tensor0 = frame2tensor(frame0, device)frame_tensor1 = frame2tensor(frame1, device)# 使用SuperPoint网络提取参考帧的特征点last_data = matching.superpoint({'image': frame_tensor0})# 将提取到的参考帧特征点数据转换为字典格式last_data = {k + '0': last_data[k] for k in keys}last_data['image0'] = frame_tensor0# 获取参考帧的特征点坐标kpts0 = last_data['keypoints0'][0].cpu().numpy()# 使用SuperGlue网络在参考帧和当前帧之间进行特征点匹配pred = matching({**last_data, 'image1': frame_tensor1})# 获取当前帧的特征点坐标kpts1 = pred['keypoints1'][0].cpu().numpy()# 获取特征点匹配结果和匹配置信度matches = pred['matches0'][0].cpu().numpy()confidence = pred['matching_scores0'][0].cpu().numpy()# 筛选出有效的匹配对valid = matches > -1mkpts0 = kpts0[valid]mkpts1 = kpts1[matches[valid]]# 打印匹配结果## print(f"----已经完成帧间的关键点匹配----")for i, (kp0, kp1) in enumerate(zip(mkpts0, mkpts1)):print(f"Match {i}: ({kp0[0]:.2f}, {kp0[1]:.2f}) -> ({kp1[0]:.2f}, {kp1[1]:.2f})")# 确保两个图像都是三通道if len(frame0.shape) == 2:vis_frame0 = cv2.cvtColor(frame0, cv2.COLOR_GRAY2BGR)else:vis_frame0 = frame0.copy()if len(frame1.shape) == 2:vis_frame1 = cv2.cvtColor(frame1, cv2.COLOR_GRAY2BGR)else:vis_frame1 = frame1.copy()# 绘制第一个输入图像及其特征点vis_frame0_with_kpts = vis_frame0.copy()for kp in kpts0:cv2.circle(vis_frame0_with_kpts, (int(kp[0]), int(kp[1])), 3, (0, 255, 0), -1)cv2.imshow("Input Frame 0 with Keypoints", vis_frame0_with_kpts)# 绘制第二个输入图像及其特征点vis_frame1_with_kpts = vis_frame1.copy()for kp in kpts1:cv2.circle(vis_frame1_with_kpts, (int(kp[0]), int(kp[1])), 3, (0, 255, 0), -1)cv2.imshow("Input Frame 1 with Keypoints", vis_frame1_with_kpts)# 绘制特征点for kp in mkpts0:cv2.circle(vis_frame0, (int(kp[0]), int(kp[1])), 3, (0, 255, 0), -1)for kp in mkpts1:cv2.circle(vis_frame1, (int(kp[0]), int(kp[1])), 3, (0, 255, 0), -1)# 调整高度一致,通过在较短的图像上下填充黑色背景max_height = max(vis_frame0.shape[0], vis_frame1.shape[0])if vis_frame0.shape[0] < max_height:diff = max_height - vis_frame0.shape[0]pad_top = np.zeros((diff // 2, vis_frame0.shape[1], 3), dtype=np.uint8)pad_bottom = np.zeros((diff - diff // 2, vis_frame0.shape[1], 3), dtype=np.uint8)vis_frame0 = np.vstack((pad_top, vis_frame0, pad_bottom))if vis_frame1.shape[0] < max_height:diff = max_height - vis_frame1.shape[0]pad_top = np.zeros((diff // 2, vis_frame1.shape[1], 3), dtype=np.uint8)pad_bottom = np.zeros((diff - diff // 2, vis_frame1.shape[1], 3), dtype=np.uint8)vis_frame1 = np.vstack((pad_top, vis_frame1, pad_bottom))# 计算右侧图像的垂直偏移量right_pad_top = pad_top.shape[0]# 绘制匹配线段concat_frame = np.hstack((vis_frame0, vis_frame1))for kp0, kp1 in zip(mkpts0, mkpts1):pt0 = (int(kp0[0]), int(kp0[1]))pt1 = (int(kp1[0]) + vis_frame0.shape[1], int(kp1[1]) + right_pad_top)cv2.line(concat_frame, pt0, pt1, (0, 255, 0), 1)# 缩小可视化窗口大小scale_factor = 1resized_frame = cv2.resize(concat_frame, None, fx=scale_factor, fy=scale_factor)# 显示可视化结果cv2.imshow("Matched Features", resized_frame)cv2.waitKey(0)cv2.destroyAllWindows()return mkpts0, mkpts1, confidence[valid]def build_pyramid(image, scale=1.2, min_size=(30, 30)):pyramid = [image]while True:last_image = pyramid[-1]width = int(last_image.shape[1] / scale)height = int(last_image.shape[0] / scale)if width < min_size[0] or height < min_size[1]:breaknext_image = cv2.resize(last_image, (width, height))pyramid.append(next_image)return pyramidif __name__ == "__main__":# 读取两帧图像frame0 = cv2.imread("/home/fairlee/786D6A341753F4B4/KITTI/sequences_kitti_00_21/01/image_0/000630.png", 0)frame1 = cv2.imread("/home/fairlee/786D6A341753F4B4/KITTI/sequences_kitti_00_21/01/image_0/000631.png", 0)# 构建 frame1 的金字塔pyramid1 = build_pyramid(frame1, scale=1.2)# # # 显示金字塔层# for i, layer in enumerate(pyramid1):#     cv2.imshow(f"Layer {i}", layer)#     cv2.waitKey(500)  # 显示500毫秒# cv2.destroyAllWindows()# 选择合适的金字塔层作为 frame1 的替代frame1_substitute = pyramid1[2]  # 例如,选择第二层# 调用match_frames_with_super_glue函数进行特征点匹配mkpts0, mkpts1, confidence = match_frames_with_super_glue(frame0, frame1_substitute)# 打印匹配结果print(f"第一帧的特征点匹配到的特征点数量: {len(mkpts0)}")print(f"第二帧的特征点匹配到的特征点数量: {len(mkpts1)}")print(f"匹配置信度的长度为: {len(confidence)}")

3. 运行结果

       代码实现展示了该方法的具体流程,通过选取合适的金字塔层作为待匹配图像的替代,实现了跨尺度的特征点匹配。实验结果表明,该方法能够有效地处理存在显著尺度变化的图像,获得数量可观且置信度较高的匹配点对,为后续的图像拼接、三维重建等任务提供了重要的基础。该方法的优越性在于巧妙地结合了图像金字塔的多尺度表示和SuperGlue的强大匹配能力,为解决复杂场景下的特征匹配难题提供了新的思路和方案。

这篇关于利用SuperGlue算法实现跨尺度金字塔特征点的高效匹配(含py代码)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1045729

相关文章

Go语言开发实现查询IP信息的MCP服务器

《Go语言开发实现查询IP信息的MCP服务器》随着MCP的快速普及和广泛应用,MCP服务器也层出不穷,本文将详细介绍如何在Go语言中使用go-mcp库来开发一个查询IP信息的MCP... 目录前言mcp-ip-geo 服务器目录结构说明查询 IP 信息功能实现工具实现工具管理查询单个 IP 信息工具的实现服

利用Python调试串口的示例代码

《利用Python调试串口的示例代码》在嵌入式开发、物联网设备调试过程中,串口通信是最基础的调试手段本文将带你用Python+ttkbootstrap打造一款高颜值、多功能的串口调试助手,需要的可以了... 目录概述:为什么需要专业的串口调试工具项目架构设计1.1 技术栈选型1.2 关键类说明1.3 线程模

SpringBoot基于配置实现短信服务策略的动态切换

《SpringBoot基于配置实现短信服务策略的动态切换》这篇文章主要为大家详细介绍了SpringBoot在接入多个短信服务商(如阿里云、腾讯云、华为云)后,如何根据配置或环境切换使用不同的服务商,需... 目录目标功能示例配置(application.yml)配置类绑定短信发送策略接口示例:阿里云 & 腾

Python Transformers库(NLP处理库)案例代码讲解

《PythonTransformers库(NLP处理库)案例代码讲解》本文介绍transformers库的全面讲解,包含基础知识、高级用法、案例代码及学习路径,内容经过组织,适合不同阶段的学习者,对... 目录一、基础知识1. Transformers 库简介2. 安装与环境配置3. 快速上手示例二、核心模

MySQL重复数据处理的七种高效方法

《MySQL重复数据处理的七种高效方法》你是不是也曾遇到过这样的烦恼:明明系统测试时一切正常,上线后却频频出现重复数据,大批量导数据时,总有那么几条不听话的记录导致整个事务莫名回滚,今天,我就跟大家分... 目录1. 重复数据插入问题分析1.1 问题本质1.2 常见场景图2. 基础解决方案:使用异常捕获3.

python实现svg图片转换为png和gif

《python实现svg图片转换为png和gif》这篇文章主要为大家详细介绍了python如何实现将svg图片格式转换为png和gif,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录python实现svg图片转换为png和gifpython实现图片格式之间的相互转换延展:基于Py

Python利用ElementTree实现快速解析XML文件

《Python利用ElementTree实现快速解析XML文件》ElementTree是Python标准库的一部分,而且是Python标准库中用于解析和操作XML数据的模块,下面小编就来和大家详细讲讲... 目录一、XML文件解析到底有多重要二、ElementTree快速入门1. 加载XML的两种方式2.

Nginx location匹配模式与规则详解

《Nginxlocation匹配模式与规则详解》:本文主要介绍Nginxlocation匹配模式与规则,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录一、环境二、匹配模式1. 精准模式2. 前缀模式(不继续匹配正则)3. 前缀模式(继续匹配正则)4. 正则模式(大

Java的栈与队列实现代码解析

《Java的栈与队列实现代码解析》栈是常见的线性数据结构,栈的特点是以先进后出的形式,后进先出,先进后出,分为栈底和栈顶,栈应用于内存的分配,表达式求值,存储临时的数据和方法的调用等,本文给大家介绍J... 目录栈的概念(Stack)栈的实现代码队列(Queue)模拟实现队列(双链表实现)循环队列(循环数组

C++如何通过Qt反射机制实现数据类序列化

《C++如何通过Qt反射机制实现数据类序列化》在C++工程中经常需要使用数据类,并对数据类进行存储、打印、调试等操作,所以本文就来聊聊C++如何通过Qt反射机制实现数据类序列化吧... 目录设计预期设计思路代码实现使用方法在 C++ 工程中经常需要使用数据类,并对数据类进行存储、打印、调试等操作。由于数据类