Semi-supervised Open-World Object Detection

2024-03-22 05:36

本文主要是介绍Semi-supervised Open-World Object Detection,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

Semi-supervised Open-World Object Detection

    • 摘要
    • 1 介绍
    • 2.准备工作
      • 提出的SS-OWOD问题设置
    • 2.1 基础架构
    • 3 方法
      • 3.1整体架构

摘要

传统的开放世界对象检测(OWOD)问题设置首先区分已知和未知类别,然后在后续任务中引入标签时逐步学习未知对象。然而,当前的OWOD公式在增量学习阶段严重依赖外部人类预言者进行知识输入。这种对运行时的依赖使得这种公式在现实世界的部署中显得不太现实。为了解决这个问题,我们引入了一个更现实的公式,名为半监督开放世界检测(SS-OWOD),通过将OWOD的增量学习阶段投射为半监督方式,减少了注释成本。我们证明了最先进的OWOD检测器在提出的SS-OWOD设置中的性能显著下降。因此,我们引入了一种新的SS-OWOD检测器,名为SS-OWFormer,它利用特征对齐方案来更好地对齐原始图像和增强图像之间的对象查询表示,以利用大量的未标记数据和少量的标记数据。我们进一步引入了一种用于未知检测的伪标签方案,该方案利用解码器对象查询捕获对象特定信息的固有能力。在COCO数据集上,我们的SS-OWFormer只使用50%的标记数据就达到了与使用所有100%标记数据的最先进(SOTA)OWOD检测器相当的检测性能。此外,我们的SS-OWFormer在未知召回率上比SOTA OWOD检测器提高了绝对4.8%。最后,我们展示了我们的SS-OWOD问题设置和方法在遥感对象检测中的有效性,提出了精心策划的分割和基线性能评估。我们在包括MS COCO、PASCAL、Objects365和DOTA在内的4个数据集上的实验证明了我们方法的有效性。我们的源代码、模型和分割可以在这里找到:https://github.com/sahalshajim/SS-OWFormer。

1 介绍

传统的对象检测器建立在一个假设之上,即模型只会遇到它在训练过程中遇到过的“已知”对象类别。最近,开放世界对象检测(OWOD)问题引起了人们的关注,其目标是检测已知和“未知”的对象,然后在后续任务中引入标签时逐步学习这些“未知”的对象。在这个问题设置中,新识别的未知对象首

这篇关于Semi-supervised Open-World Object Detection的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/834634

相关文章

文件权限修改为777,php failed to open stream: Permission denied

记录一次在谷歌云上的异常诡异的事件: 环境 centos7.5 nginx php7.0 mysql 问题: 问题一 我用相同的nginx配置,只是修改了nginx root目录。 打开/var/www/html/ 这个目录就报 2018/06/22 04:35:03 [error] 15840#0: *438 FastCGI sent in stderr: “Primary scr

Python: create object

# encoding: utf-8# 版权所有 2024 涂聚文有限公司# 许可信息查看:# 描述:# Author : geovindu,Geovin Du 涂聚文.# IDE : PyCharm 2023.1 python 3.11# Datetime : 2024/6/15 18:59# User : geovindu# Product :

【进阶篇-Day5:JAVA常用API的使用(Math、BigDecimal、Object、包装类等)】

目录 1、API的概念2、Object类2.1 Object类的介绍2.2 Object的toString()方法2.3 Object的equals()方法2.4 Objects概述 3、Math类4、System类5、BigDecimal类6、包装类6.1 包装类的概念6.2 几种包装类(1)手动转换包装类:(2)自动转换包装类:(3)Integet常用方法:(4)练习: 1

FFplay源码分析-stream_component_open

《FFmpeg原理》的社群来了,想加入社群的朋友请购买 VIP 版,VIP 版有更高级的内容与答疑服务。 本系列 以 ffmpeg4.2 源码为准,下载地址:链接:百度网盘 提取码:g3k8 FFplay 源码分析系列以一条简单的命令开始,ffplay -i a.mp4。a.mp4下载链接:百度网盘,提取码:nl0s 。 上一篇文章已经讲解完了 stream_component_op

FFplay源码分析-streams_open

《FFmpeg原理》的社群来了,想加入社群的朋友请购买 VIP 版,VIP 版有更高级的内容与答疑服务。 本系列 以 ffmpeg4.2 源码为准,下载地址:链接:百度网盘 提取码:g3k8 FFplay 源码分析系列以一条简单的命令开始,ffplay -i a.mp4。a.mp4下载链接:百度网盘,提取码:nl0s 。 如下图所示,本文主要讲解 streams_open() 函数的

FFplay源码分析-avformat_open_input

《FFmpeg原理》的社群来了,想加入社群的朋友请购买 VIP 版,VIP 版有更高级的内容与答疑服务。 本系列 以 ffmpeg4.4 源码为准,主要讲解 ffplay 的 RTMP 协议解析,播放。本文使用的命令如下: ffplay -i rtmp://192.168.0.122/live/livestream 前两篇文章 《FFplay源码分析-rtmp入口》 《FFplay源

玩转Web之Json(四)---json与(Object/List/Map)的相互转化

在做web应用时,经常需要将json转化成Object/list/map或者将Object/List/map转化成json,通过简单封装可以在写代码是减轻很多负担。本文将给出json转化的一系列方法。 闲话不 多说,直接上代码: 先是Object /List /Map转化为Json /* 功能 :将一个对象转成json数组* 参数 :object对象* retu

Selenium使用Page Object实现页面自动测试

原文转自:https://blog.csdn.net/zhenyu5211314/article/details/13632083 Page Object模式是Selenium中的一种测试设计模式,主要是将每一个页面设计为一个Class,其中包含页面中需要测试的元素(按钮,输入框,标题等),这样在Selenium测试页面中可以通过调用页面类来获取页面元素,这样巧妙的避免了当页面元素id或者位置变

AJAX:如何编写一个关于AJAX的Hello World?(ajax发送异步请求(四步操作))

用到的一个Servlet类: package cn.edu.web.servlet;import java.io.IOException;import javax.servlet.ServletException;import javax.servlet.annotation.WebServlet;import javax.servlet.http.HttpServlet;impor

oracle学习之第一个存储过程:打印Hello World

数据库对象:表、视图、索引、序列、同义词、存储过程、存储函数 存储过程:指的是存储在数据库中供所有用户程序调用的子程序叫存储过程、存储函数 存储过程和存储函数的相同点:完成特定功能的程序 存储过程和存储函数的区别:是否用return语句返回值(存储函数可以,但是存储过程不行) --第一个存储过程:打印Hello World/*调用存储过程2种方式:1、exec sayhellow