eccv专题

R-Adapter:零样本模型微调新突破,提升鲁棒性与泛化能力 | ECCV 2024

大规模图像-文本预训练模型实现了零样本分类,并在不同数据分布下提供了一致的准确性。然而,这些模型在下游任务中通常需要微调优化,这会降低对于超出分布范围的数据的泛化能力,并需要大量的计算资源。论文提出新颖的Robust Adapter(R-Adapter),可以在微调零样本模型用于下游任务的同时解决这两个问题。该方法将轻量级模块集成到预训练模型中,并采用新颖的自我集成技术以提高超出分布范围的鲁棒性

【计算机视觉前沿研究 热点 顶会】ECCV 2024中扩散模型有关的论文

神经辐射场修复的驯服潜在扩散模型 神经辐射场(NERF)是一种从多视角图像进行三维重建的表示法。尽管最近的一些工作表明,在编辑具有扩散先验的重建的 NERF 方面取得了初步成功,但他们仍然在努力在完全未覆盖的区域中合成合理的几何图形。一个主要原因是来自扩散模型的合成内容的高度多样性阻碍了辐射场收敛到清晰和确定的几何形状。此外,在实际数据上应用潜在扩散模型通常会产生与图像条件不一致的纹理漂移,这是

【计算机视觉前沿研究 热点 顶会】ECCV 2024中Mamba有关的论文

MambaIR:状态空间模型图像恢复的简单基线 近年来,图像恢复技术取得了长足的进步,这在很大程度上归功于现代深度神经网络的发展,如 CNN 和 Transformers。然而,现有的修复骨干往往面临全局接受域和高效计算之间的两难困境,阻碍了它们在实践中的应用。最近,选择性结构化状态空间模型,特别是改进的 Mamba 模型,在线性复杂度的长程依赖建模方面显示出了巨大的潜力,为解决上述困境提供了一

(ECCV-2024)SwiftBrush v2:让你的一步扩散模型比它的老师更好

SwiftBrush v2:让你的一步扩散模型比它的老师更好 Paper Title:SwiftBrush v2: Make Your One-step Diffusion Model Better Than Its Teacher paper是VinAI Research发表在ECCV 2024的工作 paper地址 Code地址 Abstract. 在本文中

2010-ECCV - Two-phase kernel estimation for robust motion deblurring

项目地址:http://www.cse.cuhk.edu.hk/~leojia/projects/robust_deblur/index.html 贾佳亚团队 边缘预测与边缘选择,过滤细微结构对于模糊核估计的影响分两阶段估计模糊核,第一阶段:L2范数,第二阶段:L1范数图像先验,在估计模糊核过程中使用空间结构先验,非盲阶段时使用TV范数 文章首先了图像结构如何影响模糊核结构: Salien

可视化理解卷积神经网络-ECCV 2014

可视化理解卷积神经网络 原文地址:http://blog.csdn.net/hjimce/article/details/50544370 作者:hjimce 一、相关理论 本篇博文主要讲解2014年ECCV上的一篇经典文献:《Visualizing and Understanding Convolutional Networks》,可以说是CNN领域可视化理解的开山之作,这篇文献告诉我们

计算机常见的六大会议介绍:CVPR/ICCV/ECCV;NeurIPS/ICML/ICLR

计算机常见的六大会议介绍:CVPR/ICCV/ECCV;NeurIPS/ICML/ICLR CVPR、ICCV和ECCV是计算机视觉领域顶级的三个国际会议,而NeurIPS、ICML和ICLR则是机器学习领域最具影响力的三个国际会议。下面是它们的详细介绍: 计算机视觉领域 CVPR (Computer Vision and Pattern Recognition) 主办方:IEEE频率:

ECCV 2022 | STDANet:基于可变形注意力的视频去模糊

原文链接:https://www.techbeat.net/article-info?id=3932 作者:张慧琮 视频去模糊的关键在于利用连续视频帧的清晰像素恢复中间帧的模糊像素。因此,主流方法通过融合多帧像素恢复模糊的中间帧。然而,这些方法没有考虑视频帧中像素的模糊程度,其实不是所有的像素都是对恢复有利的,引入视频段中模糊的像素将导致其去模糊效果不够理想。 为了解决这个问题,我们提出了

【2022 ECCV】《Unstructured Feature Decoupling for Vehicle Re-Identification》

《Unstructured Feature Decoupling for Vehicle Re-Identification》 文章目录 1.Abstract2.Introduction3.Methodology3.1Backbone and Symbol Definition3.2Transformer-based Featuren Decomposing Head3.2.1The Al

ECCV 2022 | 亚马逊提出GLASS:场景文字识别中的全局到局部注意力

点击下方卡片,关注“CVer”公众号 AI/CV重磅干货,第一时间送达 点击进入—> CV 微信技术交流群 转载自:CSIG文档图像分析与识别专委会 论文:https://arxiv.org/abs/2208.03364 代码(已开源): https://github.com/amazon-research/glass-text-spotting 本文简要介绍ECCV 2022录用论文“GLA

一次性下载CVPR/ICCV/ECCV会议所有论文并提取论文标题重命名pdf文件

转自:https://blog.csdn.net/lcz200/article/details/80813988 动机     计算机视觉领域会议近年来论文接收数量暴增,论文多得看不过来。偶尔想起来,会兴致勃勃去下载个几篇看看。但每次看都要去官网下载,挺麻烦的。为何不直接把论文全部爬下来,有空时直接翻出来看?这篇博客要干的就是这个事情。 说明     以防万一有同学看到最后发现该博客解决不

ECCV 2020 Representation Learning on Visual-Symbolic Graphs for Video Understanding

动机 自然视频中的事件通常产生于演员和目标之间的时空交互,并且涉及多个共同发生的活动和目标类。因此,需要开发能够对时空视觉和语义上下文进行有效建模的算法。 捕捉这种上下文的一种方法是使用基于图的建模,它在计算机视觉中有着丰富的历史。 传统的基于图的方法,例如使用概率图模型,主要侧重于在符号而不是信号/视觉表示的层次上对上下文进行建模。然而,最近的进步使得图结构化数据的表示学习能够使用称为图

ECCV 2018 | 国防科大、普林斯顿提出共面性检测网络:助力三维场景重建

共面性检测网络为解决这一问题提供了新的思路,并能够显著提升三维场景重建的质量。目前这项研究工作已被欧洲计算机视觉大会 (ECCV 2018) 收录,并被邀请赴会进行口头报告 (Oral Presentation)。 这项研究工作的完成者包括:国防科技大学-普林斯顿大学联合培养博士施逸飞,国防科技大学副教授、普林斯顿大学访问学者徐凯,慕尼黑工业大学教授 Matthias Niessner,普林斯顿

ECCV 2022|Snap东北大学提出R2L:用数据蒸馏加速NeRF

点击下方卡片,关注“CVer”公众号 AI/CV重磅干货,第一时间送达 点击进入—> CV 微信技术交流群 转载自:机器之心 | 作者:Huan Wang 神经辐射场 (Neural Radiance Field, or NeRF) [Mildenhall et al., ECCV, 2020] 开启了用神经网络表征三维场景的新范式。NeRF 这两年在学术界和工业界都很火热, 但 NeRF 一个

Deep coral: Correlation alignment for deep domain adaptation. ECCV 2016. Domain Adaptation

** Sun, Baochen, and Kate Saenko. “Deep coral: Correlation alignment for deep domain adaptation.” ECCV. Springer, Cham, 2016. ** 结构如图: 两个损失函数: 其中 L C L A S S \mathcal{L}_{CLASS} LCLASS​为分类损失, L

2010-ECCV - Two-phase kernel estimation for robust motion deblurring

项目地址:http://www.cse.cuhk.edu.hk/~leojia/projects/robust_deblur/index.html 贾佳亚团队 边缘预测与边缘选择,过滤细微结构对于模糊核估计的影响分两阶段估计模糊核,第一阶段:L2范数,第二阶段:L1范数图像先验,在估计模糊核过程中使用空间结构先验,非盲阶段时使用TV范数 文章首先了图像结构如何影响模糊核结构: Salien

论文阅读:(ECCV 2022) Towards Efficient and Scale-Robust Ultra-High-Definition Image Demoireing

Towards Efficient and Scale-Robust Ultra-High-Definition Image Demoireing (ECCV 2022) 2022/09/19:上个月打卡还不到十天,今天要我们交每个月的工作总结,思来想去也不知道写啥 2022/09/20: 今天就更离谱了,说我们昨天的工作总结是无效的,因为投论文没有把访问单位挂在第一单位,挂了就不算毕业条件,不

FPT:又是借鉴Transformer,这次多方向融合特征金字塔 | ECCV 2020

论文提出用于特征金字塔的高效特征交互方法FPT,包含3种精心设计的特征增强操作,分别用于借鉴层内特征进行增强、借鉴高层特征进行增强以及借鉴低层特征进行增强,FPT的输出维度与输入一致,能够自由嵌入到各种包含特征金字塔的检测算法中,从实验结果来看,效果不错   来源:晓飞的算法工程笔记 公众号 论文: Feature Pyramid Transformer 论文地址:https://a

ECCV 22丨BUTD-DETR:图像和点云的语言标定Transformer

来源:投稿 作者:橡皮 编辑:学姐 论文链接:https://arxiv.org/abs/2112.08879[1] 主页链接:https://github.com/nickgkan/butd\_detr[2] 摘要: 在二维和三维场景中,大多数模型的任务都是将指涉语句置地,学会从预先训练好的检测器提供的对象建议库中选择指涉对象。这是限制性的,因为话语可能涉及不同粒度级别的视

ECCV 2022 | 腾讯优图提出DisCo:拯救小模型在自监督学习中的效果

点击下方卡片,关注“CVer”公众号 AI/CV重磅干货,第一时间送达 作者:Linz |  已授权转载(源:知乎) https://zhuanlan.zhihu.com/p/366819594 DisCo: Remedy Self-supervised Learning on Lightweight Models with Distilled Contrastive Learning论文

【论文解读】单目3D目标检测 LPCG(ECCV 2022)

本文分享单目3D目标检测,LPCG模型的论文解读,了解它的设计思路,论文核心观点,模型结构,以及效果和性能。 目录 一、LPCG 简介 二、论文核心观点 三、思路框架 四、核心观点——单目3D目标检测的标签中,3D位置是极其关键的 五、核心内容——低成本模式,点云数据生成粗略的3D标签 六、核心内容——高精度模式,小量标注数据生成精准标签 七、在自动驾驶中应用LPCG 八、实

【论文阅读】2018-ECCV-MUNIT

卷积神经网络 基于MUNIT对抗模型的多模态风格迁移技术Part1 降维思想Part2 PCA降维算法Part3 Auto-encoder思想Part4 GAN网络红外与可见光之间的模态转换 基于MUNIT对抗模型的多模态风格迁移技术 文章中的思想主要分为以下几个步骤: 将数据集的图像降维成两类低维code:内容code和风格code,这里涉及到了降维的思想;将内容code与

ECCV 2018论文解读 | 基于三维重建的全新相机姿态估计方法

区别于先前的方法都在关注点特征和相机自运动模型,本文作者提出了一个关于 RS 相片形变的比喻: 刚体的 3D template 在 RS 相机中的形变,可以被看作一个非刚体可形变的 3D template 被 GS 相机所捕捉。从而将 2D 照片中的形变等效到了 3D 空间中,进而使用 Shape-from-Template 技术实时重建这个一直处于形变中的虚拟 3D template,最后使用

ECCV 2018 | 旷视科技夺获人工智能顶赛Wider Challenge人脸检测冠军

ECCV 2018 | 旷视科技夺获人工智能顶赛Wider Challenge人脸检测冠军 Wider Face and Pedestrian Challenge 2018(简称 Wider Challenge)是一项全球范围内的计算机视觉顶级赛事,旷视科技(Megvii)参战了其中人脸检测比赛 Wider Face,最终以 0.5582 的成绩技压群雄,勇夺人脸检测冠军。旷视科技人脸检测冠

用50张图训练,就能识别高仿山寨货!阿里安全图灵实验室获ECCV 2020挑战赛冠军...

贾浩楠 发自 凹非寺量子位 报道 | 公众号 QbitAI 阿里AI最近拿到了一个“世界第一”:计算机视觉领域顶会ECCV 2020 VIPriors挑战赛分类赛道冠军。 仅用50张图片训练,然后识别特定类别的物体,阿里安全团队的算法击败了所有参赛对手。 阿里的高效分类AI模型,可以解决戴口罩的人脸识别问题;还可以打假,识别零售市场的高仿山寨货。 训练数据50张图,堪称最难分类算法挑战 ECCV

【ECCV 2020】NeRF: Representing Scenes as Neural Radiance Fields for View Synthesis

Representing Scenes as Neural Radiance Fields for View Synthesis 论文简介:论文介绍:Neural Radiance Field Scene Representation:Volume Rendering with Radiance Fields:Optimizing a Neural Radiance Field:Positi