ICCV 2023 获奖论文公布,扩散模型、分割一切、跟踪一切摘得桂冠

2023-10-05 19:04

本文主要是介绍ICCV 2023 获奖论文公布,扩散模型、分割一切、跟踪一切摘得桂冠,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

昨天计算机视觉三大顶级会议之一的ICCV 2023在法国巴黎正式“开奖”了!今年共有两篇论文获得最佳论文奖,大名鼎鼎的“分割一切”荣获最佳论文提名。

ICCV今年共收录了2160篇论文,从今年的录用论文的主题领域来看,3D视觉、图像视频合成、迁移少样本持续学习方向排名前三。

下面我们进入正题,一起来看看ICCV 2023的获奖论文详情:

最佳论文奖

Adding Conditional Control to Text-to-Image Diffusion Models

标星2.4万,被引用量已破300+

标题:向文本到图像扩散模型添加条件控制

作者:斯坦福大学

内容:论文提出了ControlNet,这是一种神经网络架构,可向大型预训练的文本到图像扩散模型添加空间条件控制。ControlNet固定了可用于生产的大型扩散模型,并重用它们在数十亿张图像上预训练的深度和稳健的编码层,作为强大的骨干来学习各种条件控制。该神经网络架构通过“零卷积”(即初始化为零的卷积层)进行连接,逐步从零增长参数,确保调优过程不会受到任何有害噪声的影响。

Passive Ultra-Wideband Single-Photon Imaging

标题:被动超宽带单光子成像

作者:多伦多大学

内容:论文考虑同时成像一个动态场景的极端时间范围的问题——从秒到皮秒级——并且采用被动方式,不需要太多光照,也不需要来自发光源的任何定时信号。由于现有的单光子相机通量估计技术在这种情况下会失效,作者开发了一种通量探测理论,其从随机微积分中获得启发,以使我们能够从单调增加的光子检测时间戳流重构像素的时间变化通量。作者使用这一理论:(1)显示被动自由运行的单光子雪崩二极管相机在低通量条件下具有覆盖整个直流至31GHz范围的可实现频带宽,(2)推导出一种新的傅里叶域通量重建算法,它扫描时间戳数据中具有统计显著支持的频率范围,(3)确保该算法的噪声模型甚至在非常低的光子计数或不可忽略的死时间下仍然有效。

最佳论文荣誉提名奖

Segment Anything

标星4万,被引用量690

标题:分割一切

作者:Meta

内容:论文提出了“分割任何物体”(Segment Anything)项目:一个用于图像分割的新任务、模型和数据集。利用高效的模型进行数据收集,作者构建了迄今为止最大的分割数据集(目前是最大的),包含超过10亿个掩膜和1100万张授权和尊重隐私的图像。该模型的设计和训练使其可以即兴提示,因此可以零样本向新图像分布和任务进行转移。

最佳学生论文奖

Tracking Everything Everywhere All at Once

标题:随时随地追踪一切

作者:康奈尔大学

内容:论文提出了一种新的测试时优化方法,用于从视频序列中估计稠密和长距离运动。以前的光流或粒子视频跟踪算法通常在有限的时间窗口内运行,在遮挡情况下跟踪效果不佳,估计的运动轨迹整体一致性较差。作者提出了一种完整的全局一致运动表示OmniMotion,可以准确地对视频中的每个像素进行全过程运动估计。OmniMotion使用准三维规范体积表示视频,并通过局部空间和规范空间之间的双射进行像素级跟踪。这种表示允许我们确保全局一致性,跟踪遮挡情况,并建模任意组合的相机和物体运动。

其他奖项

Helmholtz 奖

Action recognition with improved trajectories

标题:使用过改进的轨迹进行动作识别

作者:Heng Wang, Cordelia Schmid

内容:最近,稠密轨迹被证明是动作识别的一种高效视频表示,并在各种数据集上获得了最先进的结果。本文通过考虑相机运动来校正轨迹,从而提高了其性能。为了估计相机运动,作者使用SURF描述子和稠密光流匹配帧之间的特征点,然后使用这些匹配来用RANSAC稳健地估计单应矩阵。人体运动通常与相机运动不同,会生成不一致的匹配。为了改进估计,使用人体检测器去除这些匹配。给定估计的相机运动,作者删除与其一致的轨迹,还使用此估计从光流中消除相机运动,这显著改进了基于运动的描述子,如HOF和MBH。

PAMI Everingham 奖

  • The Ceres Solver open source non-linear optimization software library

  • The Common Objects in Context (COCO) dataset

获奖候选

  • Adding Conditional Control to Text-to-lmage Diffusion Models - Zhang et al.

  • Advancing Example Exploltation Can Alleviate Critical Challenges in Adversarial Training -Ge et al.

  • DiffusionDet: Diffusion Model for Object Detection - Chen et al

  • ITI-GEN: Inclusive Text-to-lmage Generation - Zhang et al.

  • Passive Ultra-Wideband Single-Photon imaging - Wei et al.

  • Ref-NeuS:Ambiguity-Reduced Neural implicit Surface Learning for Multi-View Reconstruction with Reflection -Ge et al.

  • Scale-MAE: A Scale-Aware Masked Autoencoder for Multiscale Geospatfal Representation Learning - Reed et al.

  • Segment Anything - Kirillov et al.

  • Shape Analysis of Euclidean Curves under Frenet-Serret Framework -Chassat et al.

  • The Victim and The Beneficiary: Exploiting a Potsoned Model to Train a Clean Model on Poisoned Data - Zhu et al.

  • Tracking Everything Everywhere All at Once-Wang et al.

  • Tri-MipRF: Tri-Mip Representation for Effcient Anti-Aliasing Neural Radiance Fields -Hu et al.

  • UniDexGrasp++: improving Universal Dexterous Grasping via Geometry-aware Curriculum Learning and terative Generalist-Specialist Learning - Wan et al.

  • Viewing Graph Solvability in Practice - Arrigoni et al.

  • VQ3D: Learning a 3D-Aware Generative Modet on imageNet-Sarget et al.

  • When Noisy Labels Meet Long Tail Dilemmas: A Representation Calibration Method -Zhang et al.

  • Zip-NeRF: Anti-Allased Grid-Based Neural Radiance Fields - Barron et al.

关注下方《学姐带你玩AI》🚀🚀🚀

回复“ICCV获奖”获取全部获奖论文+代码+录用清单合集

码字不易,欢迎大家点赞评论收藏!

这篇关于ICCV 2023 获奖论文公布,扩散模型、分割一切、跟踪一切摘得桂冠的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/151861

相关文章

Java的IO模型、Netty原理解析

《Java的IO模型、Netty原理解析》Java的I/O是以流的方式进行数据输入输出的,Java的类库涉及很多领域的IO内容:标准的输入输出,文件的操作、网络上的数据传输流、字符串流、对象流等,这篇... 目录1.什么是IO2.同步与异步、阻塞与非阻塞3.三种IO模型BIO(blocking I/O)NI

基于Flask框架添加多个AI模型的API并进行交互

《基于Flask框架添加多个AI模型的API并进行交互》:本文主要介绍如何基于Flask框架开发AI模型API管理系统,允许用户添加、删除不同AI模型的API密钥,感兴趣的可以了解下... 目录1. 概述2. 后端代码说明2.1 依赖库导入2.2 应用初始化2.3 API 存储字典2.4 路由函数2.5 应

C++字符串提取和分割的多种方法

《C++字符串提取和分割的多种方法》在C++编程中,字符串处理是一个常见的任务,尤其是在需要从字符串中提取特定数据时,本文将详细探讨如何使用C++标准库中的工具来提取和分割字符串,并分析不同方法的适用... 目录1. 字符串提取的基本方法1.1 使用 std::istringstream 和 >> 操作符示

一文详解SQL Server如何跟踪自动统计信息更新

《一文详解SQLServer如何跟踪自动统计信息更新》SQLServer数据库中,我们都清楚统计信息对于优化器来说非常重要,所以本文就来和大家简单聊一聊SQLServer如何跟踪自动统计信息更新吧... SQL Server数据库中,我们都清楚统计信息对于优化器来说非常重要。一般情况下,我们会开启"自动更新

C#集成DeepSeek模型实现AI私有化的流程步骤(本地部署与API调用教程)

《C#集成DeepSeek模型实现AI私有化的流程步骤(本地部署与API调用教程)》本文主要介绍了C#集成DeepSeek模型实现AI私有化的方法,包括搭建基础环境,如安装Ollama和下载DeepS... 目录前言搭建基础环境1、安装 Ollama2、下载 DeepSeek R1 模型客户端 ChatBo

SpringBoot快速接入OpenAI大模型的方法(JDK8)

《SpringBoot快速接入OpenAI大模型的方法(JDK8)》本文介绍了如何使用AI4J快速接入OpenAI大模型,并展示了如何实现流式与非流式的输出,以及对函数调用的使用,AI4J支持JDK8... 目录使用AI4J快速接入OpenAI大模型介绍AI4J-github快速使用创建SpringBoot

0基础租个硬件玩deepseek,蓝耘元生代智算云|本地部署DeepSeek R1模型的操作流程

《0基础租个硬件玩deepseek,蓝耘元生代智算云|本地部署DeepSeekR1模型的操作流程》DeepSeekR1模型凭借其强大的自然语言处理能力,在未来具有广阔的应用前景,有望在多个领域发... 目录0基础租个硬件玩deepseek,蓝耘元生代智算云|本地部署DeepSeek R1模型,3步搞定一个应

Deepseek R1模型本地化部署+API接口调用详细教程(释放AI生产力)

《DeepseekR1模型本地化部署+API接口调用详细教程(释放AI生产力)》本文介绍了本地部署DeepSeekR1模型和通过API调用将其集成到VSCode中的过程,作者详细步骤展示了如何下载和... 目录前言一、deepseek R1模型与chatGPT o1系列模型对比二、本地部署步骤1.安装oll

Spring AI Alibaba接入大模型时的依赖问题小结

《SpringAIAlibaba接入大模型时的依赖问题小结》文章介绍了如何在pom.xml文件中配置SpringAIAlibaba依赖,并提供了一个示例pom.xml文件,同时,建议将Maven仓... 目录(一)pom.XML文件:(二)application.yml配置文件(一)pom.xml文件:首

如何在本地部署 DeepSeek Janus Pro 文生图大模型

《如何在本地部署DeepSeekJanusPro文生图大模型》DeepSeekJanusPro模型在本地成功部署,支持图片理解和文生图功能,通过Gradio界面进行交互,展示了其强大的多模态处... 目录什么是 Janus Pro1. 安装 conda2. 创建 python 虚拟环境3. 克隆 janus