CVPR 2022 | 只需要一组预训练参数,所有恶劣天气一次解决!

2023-11-23 07:59

本文主要是介绍CVPR 2022 | 只需要一组预训练参数,所有恶劣天气一次解决!,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

点击下方卡片,关注“CVer”公众号

AI/CV重磅干货,第一时间送达

点击进入—> CV 微信技术交流群

[CVPR'22] 只需要一组预训练参数,所有恶劣天气一次解决!

科研机构:台湾大学

论文链接:

https://openaccess.thecvf.com/content/CVPR2022/papers/Chen_Learning_Multiple_Adverse_Weather_Removal_via_Two-Stage_Knowledge_Learning_and_CVPR_2022_paper.pdf

代码链接:https://github.com/fingerk28/Two-stage-Knowledge-For-Multiple-Adverse-Weather-Removal

2e0989dd0428f867bf9b3d2283e6d62b.png

最近CVPR'22的文章已经放出来了,发现了这篇能够一次解决所有恶劣天气的算法,相当有趣以及新颖,因此整理下来分享给大家,目前训练代码,预训练模型皆已开源。

简介

当前针对恶劣天气的影像复原算法虽然已经发展多年并且已经成熟,但是有着许多的限制:

  1. 单张影像还原(Single Weather Removal) [1,2]: 虽然能够在单种气候下获得良好的效果,但是对于其他天气而言效果相当有限,因为所设计的架构大多数是针对某种气候的特征去设计,不利于真实世界的应用。

  2. 多重天气还原(Multi-degradation removal) [3]: 可以使用同一种架构去针对不同还原任务去做训练,但是一种还原就要训练一组参数,并且必须事先分辨是哪一种还原任务。

  3. 多合一天气还原 (All-in-one Bad Weather Removal) [4]: 虽然使用Neural architecture search运用一个编码器搜索特征,能够实现一组预训练模型解决所有的天气,但是一种天气就需要一种译码器,对于模型有着大小的不便性。

对于真实世界而言影像还原模型需要能够在不增加运算需求以及模型大小的情况下扩充还原的型态,并且同时有着良好的性能,本篇文章针对这个问题,基于知识蒸馏(Knowledge Distillation)提出了一个新颖的算法,能够在不增加运算资源的情况下在多种天气下达到相当好的性能。

此外,这个团队在过去对于影像还原有许多发表:

  • 单张影像去雪:[JSTASR] (ECCV'20) 、 [HDCW-Net] (ICCV'21)

  • 单张影像去雾:[PMS-Net] (CVPR'19) and [PMHLD] (TIP'20)

  • 单张影像去雨:[ContouletNet] (BMVC'21)

方法

Two-stage Knowledge Learning

39bed0df348f63d6be453fd15d8ae532.png

现有的单种天气算法使用传统的知识蒸馏将干净影像的信息转移到学生网络上,虽然有效,但适用于多天气型态将会失效,因为学生网络在缺少有效的指引的情况下无法有效地在不同天气型态当中学习到有鉴别性的特征。

为了解决此问题,此论文将网络的学习分为Knowledge Collation (KC) 以及 Knowledge Examination (KE):

  • Knowledge Collation (KC): 此阶段中,有多种针对不同气候的老师网络,负责将其知识转移到学生网络中。学生网络负责学习以及整合不同的知识。由于学生网络在此阶段并不成熟,因此,会使用较简单的约束条件去训练。

  • Knowledge Examination (KE): 经过KC阶段的学习,此阶段学生网络已经足够成熟,因此,不再和老师学习,直接和ground truth去做学习,并且使用较难的约束去训练。

Collaborative Knowledge Transfer (CKT)

2e2eaff98333a0fa674631e0e556ff1b.png

在KC阶段当中,我们透过CKT对于学生网络去做知识的转移以及整合,首先透过progressive feature projector (PFP) 将老师所学习到的特征,透过卷积网络投影到一个common feature space去做学习,并且去算损失函数。然而,由于不能保证投影过去的特征为有效特征,因此,又设计了一个双向的投影bi-directional feature matching (BFM)用于保证投影的特征是有效的。详细的内容请参阅论文。

Multi-contrastive Regularization

cb2bc8bf95bacde1ca62cba0df5223e0.png

启发于对比学习contrastive learning,针对不同阶段,设计出不同难度的对比学习:soft contrastive regularization 以及 hard contrastive regularization.

  • Soft Contrastive Regularization (SCR): 此为较简单的对比学习,用于和老师网络所得到的结果去做对比学习,并且每一次损失的计算都是针对不同气候下去做。

  • Hard Contrastive Regularization (HCR):此为较困难的对比学习,用于和ground truth去做对比学习,计算损失的函数时,将所有不同天气一起混合去做计算,增加约束的难度。

实验结果

此篇论文做了许多实验来证明其有效性。

消融实验(Ablation Study):

  • 针对在Collaborative Knowledge中提出的不同架构去做验证:

413da3b3fa53274c93b85ebef84a3255.png

结果表明了使用论文中提出的所有模块有助于提升在不同气候下的还原效能。

  • 使用two-stage knowledge learning对于学习不同气候的性能提升有效性:

43f94098c506232734aebba2c0247e7e.png

实验结果表明了两阶段的学习对于模型的效能提升有着相当大的帮助。

  • 使用两种不同的multi-contrastive regularization对于模型性能的影响:

020bf21168d4312e3ed06aa2b2505889.png

上图证明了,在不同阶段使用不同难度的对比学习对于模型的性能有着很大的帮助。

  • t-SNE去针对不同输入的气候去做探讨以及模型的feature可视化:

2a81a895cf13e721c20e6383c94a9847.png

与现有方法的比较

032ac2694b267d3ec581b45cfa6bc6cb.png

278c23be1df54f5b2d3ef635adc94cae.png

可以发现在不同任务上,虽然无法达到完全state-of-the-art的效能,但是对于一次处理所有气候的效能上,此方法为最优解。

结语

读完这篇文章后,我认为这篇论文有几点非常值得参考

  1. 使用collaborative knowledge Transfer去做不同的天气型态学习,并且设计多种模块帮助学习对于多天气学习是相当有帮助的。

  2. 使用multi-contrastive regularization及two-stage knowledge learning能够帮助模型根据不同的难度去做知识的学习。

  3. 此应用未来对于自驾车以及户外监控可能会有很大的帮助,此外,虽说论文是针对恶劣天气去设计,但我认为此方法应该能延展到其他的影像还原任务(超分、去模糊、去躁)。

参考文献

[1] He Zhang and Vishal M Patel. Densely connected pyramid dehazing network. In CVPR, 2018.

[2] Ruoteng Li, Loong-Fah Cheong, and Robby T Tan. Heavy rain image restoration: Integrating physics model and conditional adversarial learning. In CVPR, 2019.

[3] Syed Waqas Zamir, Aditya Arora, Salman Khan, Munawar Hayat, Fahad Shahbaz Khan, Ming-Hsuan Yang, and Ling Shao. Multi-stage progressive image restoration. In CVPR, 2021.

[4] Ruoteng Li, Robby T Tan, and Loong-Fah Cheong. All in one bad weather removal using architectural search. In CVPR, 2020.

点击进入—> CV 微信技术交流群

 
 
 

ICCV和CVPR 2021论文和代码下载

后台回复:CVPR2021,即可下载CVPR 2021论文和代码开源的论文合集

后台回复:ICCV2021,即可下载ICCV 2021论文和代码开源的论文合集

后台回复:Transformer综述,即可下载最新的3篇Transformer综述PDF

目标检测和Transformer交流群成立
扫描下方二维码,或者添加微信:CVer6666,即可添加CVer小助手微信,便可申请加入CVer-目标检测或者Transformer 微信交流群。另外其他垂直方向已涵盖:目标检测、图像分割、目标跟踪、人脸检测&识别、OCR、姿态估计、超分辨率、SLAM、医疗影像、Re-ID、GAN、NAS、深度估计、自动驾驶、强化学习、车道线检测、模型剪枝&压缩、去噪、去雾、去雨、风格迁移、遥感图像、行为识别、视频理解、图像融合、图像检索、论文投稿&交流、PyTorch、TensorFlow和Transformer等。
一定要备注:研究方向+地点+学校/公司+昵称(如目标检测或者Transformer+上海+上交+卡卡),根据格式备注,可更快被通过且邀请进群▲扫码或加微信: CVer6666,进交流群
CVer学术交流群(知识星球)来了!想要了解最新最快最好的CV/DL/ML论文速递、优质开源项目、学习教程和实战训练等资料,欢迎扫描下方二维码,加入CVer学术交流群,已汇集数千人!▲扫码进群
▲点击上方卡片,关注CVer公众号
整理不易,请点赞和在看

这篇关于CVPR 2022 | 只需要一组预训练参数,所有恶劣天气一次解决!的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/416474

相关文章

关于数据埋点,你需要了解这些基本知识

产品汪每天都在和数据打交道,你知道数据来自哪里吗? 移动app端内的用户行为数据大多来自埋点,了解一些埋点知识,能和数据分析师、技术侃大山,参与到前期的数据采集,更重要是让最终的埋点数据能为我所用,否则可怜巴巴等上几个月是常有的事。   埋点类型 根据埋点方式,可以区分为: 手动埋点半自动埋点全自动埋点 秉承“任何事物都有两面性”的道理:自动程度高的,能解决通用统计,便于统一化管理,但个性化定

Andrej Karpathy最新采访:认知核心模型10亿参数就够了,AI会打破教育不公的僵局

夕小瑶科技说 原创  作者 | 海野 AI圈子的红人,AI大神Andrej Karpathy,曾是OpenAI联合创始人之一,特斯拉AI总监。上一次的动态是官宣创办一家名为 Eureka Labs 的人工智能+教育公司 ,宣布将长期致力于AI原生教育。 近日,Andrej Karpathy接受了No Priors(投资博客)的采访,与硅谷知名投资人 Sara Guo 和 Elad G

C++11第三弹:lambda表达式 | 新的类功能 | 模板的可变参数

🌈个人主页: 南桥几晴秋 🌈C++专栏: 南桥谈C++ 🌈C语言专栏: C语言学习系列 🌈Linux学习专栏: 南桥谈Linux 🌈数据结构学习专栏: 数据结构杂谈 🌈数据库学习专栏: 南桥谈MySQL 🌈Qt学习专栏: 南桥谈Qt 🌈菜鸡代码练习: 练习随想记录 🌈git学习: 南桥谈Git 🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈�

如何在页面调用utility bar并传递参数至lwc组件

1.在app的utility item中添加lwc组件: 2.调用utility bar api的方式有两种: 方法一,通过lwc调用: import {LightningElement,api ,wire } from 'lwc';import { publish, MessageContext } from 'lightning/messageService';import Ca

如何解决线上平台抽佣高 线下门店客流少的痛点!

目前,许多传统零售店铺正遭遇客源下降的难题。尽管广告推广能带来一定的客流,但其费用昂贵。鉴于此,众多零售商纷纷选择加入像美团、饿了么和抖音这样的大型在线平台,但这些平台的高佣金率导致了利润的大幅缩水。在这样的市场环境下,商家之间的合作网络逐渐成为一种有效的解决方案,通过资源和客户基础的共享,实现共同的利益增长。 以最近在上海兴起的一个跨行业合作平台为例,该平台融合了环保消费积分系统,在短

4B参数秒杀GPT-3.5:MiniCPM 3.0惊艳登场!

​ 面壁智能 在 AI 的世界里,总有那么几个时刻让人惊叹不已。面壁智能推出的 MiniCPM 3.0,这个仅有4B参数的"小钢炮",正在以惊人的实力挑战着 GPT-3.5 这个曾经的AI巨人。 MiniCPM 3.0 MiniCPM 3.0 MiniCPM 3.0 目前的主要功能有: 长上下文功能:原生支持 32k 上下文长度,性能完美。我们引入了

业务中14个需要进行A/B测试的时刻[信息图]

在本指南中,我们将全面了解有关 A/B测试 的所有内容。 我们将介绍不同类型的A/B测试,如何有效地规划和启动测试,如何评估测试是否成功,您应该关注哪些指标,多年来我们发现的常见错误等等。 什么是A/B测试? A/B测试(有时称为“分割测试”)是一种实验类型,其中您创建两种或多种内容变体——如登录页面、电子邮件或广告——并将它们显示给不同的受众群体,以查看哪一种效果最好。 本质上,A/B测

pip-tools:打造可重复、可控的 Python 开发环境,解决依赖关系,让代码更稳定

在 Python 开发中,管理依赖关系是一项繁琐且容易出错的任务。手动更新依赖版本、处理冲突、确保一致性等等,都可能让开发者感到头疼。而 pip-tools 为开发者提供了一套稳定可靠的解决方案。 什么是 pip-tools? pip-tools 是一组命令行工具,旨在简化 Python 依赖关系的管理,确保项目环境的稳定性和可重复性。它主要包含两个核心工具:pip-compile 和 pip

【VUE】跨域问题的概念,以及解决方法。

目录 1.跨域概念 2.解决方法 2.1 配置网络请求代理 2.2 使用@CrossOrigin 注解 2.3 通过配置文件实现跨域 2.4 添加 CorsWebFilter 来解决跨域问题 1.跨域概念 跨域问题是由于浏览器实施了同源策略,该策略要求请求的域名、协议和端口必须与提供资源的服务相同。如果不相同,则需要服务器显式地允许这种跨域请求。一般在springbo

AI(文生语音)-TTS 技术线路探索学习:从拼接式参数化方法到Tacotron端到端输出

AI(文生语音)-TTS 技术线路探索学习:从拼接式参数化方法到Tacotron端到端输出 在数字化时代,文本到语音(Text-to-Speech, TTS)技术已成为人机交互的关键桥梁,无论是为视障人士提供辅助阅读,还是为智能助手注入声音的灵魂,TTS 技术都扮演着至关重要的角色。从最初的拼接式方法到参数化技术,再到现今的深度学习解决方案,TTS 技术经历了一段长足的进步。这篇文章将带您穿越时