CVPR2021 | 最新CVPR2021论文抢先看,附全部下载链接!

2024-01-23 14:58

本文主要是介绍CVPR2021 | 最新CVPR2021论文抢先看,附全部下载链接!,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

CVPR2021最全1660篇pdf(4.3G)

 链接: https://pan.baidu.com/s/1GWkqUOcO6KMOu-uLJrSpbA 提取码: vwkx 

持续更新Github:

https://github.com/Sophia-11/Awesome-CVPR-Paper 

2021持续论文集锦百度云请在【计算机视觉联盟】后台回复  CVPR2021

往年论文集锦请在【计算机视觉联盟】后台回复  CVPR2019 

2020持续论文集锦请在【计算机视觉联盟】后台回复  CVPR2020

CVPR 2021

致力于计算机视觉和模式识别包括颜色检测、跟踪、运动、物体识别、音响和目标检测。

  • Image-to-image Translation via Hierarchical Style Disentanglement Xinyang Li, Shengchuan Zhang, Jie Hu, Liujuan Cao, Xiaopeng Hong, Xudong Mao, Feiyue Huang, Yongjian Wu, Rongrong Ji https://arxiv.org/abs/2103.01456 https://github.com/imlixinyang/HiSD
  • FLAVR: Flow-Agnostic Video Representations for Fast Frame Interpolation https://arxiv.org/pdf/2012.08512.pdf https://tarun005.github.io/FLAVR/Code https://tarun005.github.io/FLAVR/
  • Patch-NetVLAD: Multi-Scale Fusion of Locally-Global Descriptors for Place Recognition Stephen Hausler, Sourav Garg, Ming Xu, Michael Milford, Tobias Fischer https://arxiv.org/abs/2103.01486
  • Depth from Camera Motion and Object Detection Brent A. Griffin, Jason J. Corso https://arxiv.org/abs/2103.01468
  • UP-DETR: Unsupervised Pre-training for Object Detection with Transformers https://arxiv.org/pdf/2011.09094.pdf
  • Multi-Stage Progressive Image Restoration https://arxiv.org/abs/2102.02808 https://github.com/swz30/MPRNet
  • Weakly Supervised Learning of Rigid 3D Scene Flow https://arxiv.org/pdf/2102.08945.pdf https://arxiv.org/pdf/2102.08945.pdf https://3dsceneflow.github.io/
  • Exploring Complementary Strengths of Invariant and Equivariant Representations for Few-Shot Learning Mamshad Nayeem Rizve, Salman Khan, Fahad Shahbaz Khan, Mubarak Shah https://arxiv.org/abs/2103.01315
  • Re-labeling ImageNet: from Single to Multi-Labels, from Global to Localized Labels https://arxiv.org/abs/2101.05022 https://github.com/naver-ai/relabel_imagenet
  • Rethinking Channel Dimensions for Efficient Model Design https://arxiv.org/abs/2007.00992 https://github.com/clovaai/rexnet
  • Coarse-Fine Networks for Temporal Activity Detection in Videos Kumara Kahatapitiya, Michael S. Ryoo https://arxiv.org/abs/2103.01302
  • A Deep Emulator for Secondary Motion of 3D Characters Mianlun Zheng, Yi Zhou, Duygu Ceylan, Jernej Barbic https://arxiv.org/abs/2103.01261
  • Fair Attribute Classification through Latent Space De-biasing https://arxiv.org/abs/2012.01469 https://github.com/princetonvisualai/gan-debiasing https://princetonvisualai.github.io/gan-debiasing/
  • Auto-Exposure Fusion for Single-Image Shadow Removal Lan Fu, Changqing Zhou, Qing Guo, Felix Juefei-Xu, Hongkai Yu, Wei Feng, Yang Liu, Song Wang https://arxiv.org/abs/2103.01255
  • Less is More: CLIPBERT for Video-and-Language Learning via Sparse Sampling https://arxiv.org/pdf/2102.06183.pdf https://github.com/jayleicn/ClipBERT
  • MetaSCI: Scalable and Adaptive Reconstruction for Video Compressive Sensing Zhengjue Wang, Hao Zhang, Ziheng Cheng, Bo Chen, Xin Yuan https://arxiv.org/abs/2103.01786
  • AttentiveNAS: Improving Neural Architecture Search via Attentive https://arxiv.org/pdf/2011.09011.pdf
  • Diffusion Probabilistic Models for 3D Point Cloud Generation Shitong Luo, Wei Hu https://arxiv.org/abs/2103.01458
  • There is More than Meets the Eye: Self-Supervised Multi-Object Detection and Tracking with Sound by Distilling Multimodal Knowledge Francisco Rivera Valverde, Juana Valeria Hurtado, Abhinav Valada https://arxiv.org/abs/2103.01353 http://rl.uni-freiburg.de/research/multimodal-distill
  • Encoding in Style: a StyleGAN Encoder for Image-to-Image Translation https://arxiv.org/abs/2008.00951 https://github.com/eladrich/pixel2style2pixel https://eladrich.github.io/pixel2style2pixel/
  • Hierarchical and Partially Observable Goal-driven Policy Learning with Goals Relational Graph Xin Ye, Yezhou Yang https://arxiv.org/abs/2103.01350
  • RepVGG: Making VGG-style ConvNets Great Again https://arxiv.org/abs/2101.03697 https://github.com/megvii-model/RepVGG
  • Transformer Interpretability Beyond Attention Visualization https://arxiv.org/pdf/2012.09838.pdf https://github.com/hila-chefer/Transformer-Explainability
  • PREDATOR: Registration of 3D Point Clouds with Low Overlap https://arxiv.org/pdf/2011.13005.pdf https://github.com/ShengyuH/OverlapPredator https://overlappredator.github.io/

CVPR 2021涵盖的话题:

  • 分段和分组
  • 运动和跟踪
  • 人类的认识
  • Shape-from-X
  • 音响和结构与运动
  • 颜色和纹理
  • 照明和反射建模
  • 基于图像的建模
  • 传感器
  • 形状表示和匹配
  • 计算摄影和视频
  • 早期和生物启发的愿景
  • 视频分析和事件识别
  • 优化方法
  • 脸和姿态分析
  • 视频监控
  • 现场了解
  • 图像和视频检索
  • 医学图像分析
  • 对机器人的愿景
  • 对图形的愿景
  • 统计方法和学习
  • 计算机视觉的应用
  • 文档分析
  • 对象识别/检测/分类

图像处理

  1. Learning to Shade Hand-drawn Sketches 论文地址:https://arxiv.org/abs/2002.11812

2.Single Image Reflection Removal through Cascaded Refinement 论文地址:https://arxiv.org/abs/1911.06634

3.Generalized ODIN: Detecting Out-of-distribution Image without Learning from Out-of-distribution Data 论文地址:https://arxiv.org/abs/2002.11297

  1. Deep Image Harmonization via Domain Verification 论文地址:https://arxiv.org/abs/1911.13239 代码:https://github.com/bcmi/Image_Harmonization_Datasets

  2. RoutedFusion: Learning Real-time Depth Map Fusion 论文地址:https://arxiv.org/pdf/2001.04388.pdf

 

更新

  1. 视觉常识R-CNN,Visual Commonsense R-CNN

https://arxiv.org/abs/2002.12204

  1. Out-of-distribution图像检测

https://arxiv.org/abs/2002.11297

  1. 模糊视频帧插值,Blurry Video Frame Interpolation

https://arxiv.org/abs/2002.12259

  1. 元迁移学习零样本超分

https://arxiv.org/abs/2002.12213

  1. 3D室内场景理解

https://arxiv.org/abs/2002.12212

6.从有偏训练生成无偏场景图

https://arxiv.org/abs/2002.11949

  1. 自动编码双瓶颈哈希

https://arxiv.org/abs/2002.11930

  1. 一种用于人类轨迹预测的社会时空图卷积神经网络

https://arxiv.org/abs/2002.11927

  1. 面向面向深度人脸识别的通用表示学习

https://arxiv.org/abs/2002.11841

  1. 视觉表示泛化性

https://arxiv.org/abs/1912.03330

  1. 减弱上下文偏差

https://arxiv.org/abs/2002.11812

  1. 可迁移元技能的无监督强化学习

https://arxiv.org/abs/1911.07450

  1. 快速准确时空视频超分

https://arxiv.org/abs/2002.11616

  1. 对象关系图Teacher推荐学习的视频captioning

https://arxiv.org/abs/2002.11566

  1. 弱监督物体定位路由再思考

https://arxiv.org/abs/2002.11359

  1. 通过预培训学习视觉和语言导航的通用代理

https://arxiv.org/pdf/2002.10638.pdf

  1. GhostNet轻量级神经网络

https://arxiv.org/pdf/1911.11907.pdf

  1. AdderNet:在深度学习中,我们真的需要乘法吗?

https://arxiv.org/pdf/1912.13200.pdf

  1. CARS:高效神经结构搜索的持续进化

https://arxiv.org/abs/1909.04977

  1. 通过协作式的迭代级联微调来移除单图像中的反射

https://arxiv.org/abs/1911.06634

  1. 深度神经网络的滤波嫁接

https://arxiv.org/pdf/2001.05868.pdf

  1. PolarMask:将实例分割统一到FCN

https://arxiv.org/pdf/1909.13226.pdf

  1. 半监督语义图像分割

https://arxiv.org/pdf/1811.07073.pdf

  1. 通过选择性的特征再生来抵御通用攻击

https://arxiv.org/pdf/1906.03444.pdf

  1. 实时的基于细粒度草图的图像检索

https://arxiv.org/abs/2002.10310

  1. 用子问题询问VQA模型

https://arxiv.org/abs/1906.03444

  1. 从2D范例中学习神经三维纹理空间

https://geometry.cs.ucl.ac.uk/projects/2020/neuraltexture/

  1. NestedVAE:通过薄弱的监督来隔离共同因素

https://arxiv.org/abs/2002.11576

  1. 实现多未来轨迹预测

https://arxiv.org/pdf/1912.06445.pdf

  1. 使用序列注意力模型进行稳健的图像分类

https://arxiv.org/pdf/1912.02184

这篇关于CVPR2021 | 最新CVPR2021论文抢先看,附全部下载链接!的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/636703

相关文章

Andrej Karpathy最新采访:认知核心模型10亿参数就够了,AI会打破教育不公的僵局

夕小瑶科技说 原创  作者 | 海野 AI圈子的红人,AI大神Andrej Karpathy,曾是OpenAI联合创始人之一,特斯拉AI总监。上一次的动态是官宣创办一家名为 Eureka Labs 的人工智能+教育公司 ,宣布将长期致力于AI原生教育。 近日,Andrej Karpathy接受了No Priors(投资博客)的采访,与硅谷知名投资人 Sara Guo 和 Elad G

常用的jdk下载地址

jdk下载地址 安装方式可以看之前的博客: mac安装jdk oracle 版本:https://www.oracle.com/java/technologies/downloads/ Eclipse Temurin版本:https://adoptium.net/zh-CN/temurin/releases/ 阿里版本: github:https://github.com/

安卓链接正常显示,ios#符被转义%23导致链接访问404

原因分析: url中含有特殊字符 中文未编码 都有可能导致URL转换失败,所以需要对url编码处理  如下: guard let allowUrl = webUrl.addingPercentEncoding(withAllowedCharacters: .urlQueryAllowed) else {return} 后面发现当url中有#号时,会被误伤转义为%23,导致链接无法访问

秋招最新大模型算法面试,熬夜都要肝完它

💥大家在面试大模型LLM这个板块的时候,不知道面试完会不会复盘、总结,做笔记的习惯,这份大模型算法岗面试八股笔记也帮助不少人拿到过offer ✨对于面试大模型算法工程师会有一定的帮助,都附有完整答案,熬夜也要看完,祝大家一臂之力 这份《大模型算法工程师面试题》已经上传CSDN,还有完整版的大模型 AI 学习资料,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

AI hospital 论文Idea

一、Benchmarking Large Language Models on Communicative Medical Coaching: A Dataset and a Novel System论文地址含代码 大多数现有模型和工具主要迎合以患者为中心的服务。这项工作深入探讨了LLMs在提高医疗专业人员的沟通能力。目标是构建一个模拟实践环境,人类医生(即医学学习者)可以在其中与患者代理进行医学

AI Toolkit + H100 GPU,一小时内微调最新热门文生图模型 FLUX

上个月,FLUX 席卷了互联网,这并非没有原因。他们声称优于 DALLE 3、Ideogram 和 Stable Diffusion 3 等模型,而这一点已被证明是有依据的。随着越来越多的流行图像生成工具(如 Stable Diffusion Web UI Forge 和 ComyUI)开始支持这些模型,FLUX 在 Stable Diffusion 领域的扩展将会持续下去。 自 FLU

论文翻译:arxiv-2024 Benchmark Data Contamination of Large Language Models: A Survey

Benchmark Data Contamination of Large Language Models: A Survey https://arxiv.org/abs/2406.04244 大规模语言模型的基准数据污染:一项综述 文章目录 大规模语言模型的基准数据污染:一项综述摘要1 引言 摘要 大规模语言模型(LLMs),如GPT-4、Claude-3和Gemini的快

论文阅读笔记: Segment Anything

文章目录 Segment Anything摘要引言任务模型数据引擎数据集负责任的人工智能 Segment Anything Model图像编码器提示编码器mask解码器解决歧义损失和训练 Segment Anything 论文地址: https://arxiv.org/abs/2304.02643 代码地址:https://github.com/facebookresear

2. 下载rknn-toolkit2项目

官网链接: https://github.com/airockchip/rknn-toolkit2 安装好git:[[1. Git的安装]] 下载项目: git clone https://github.com/airockchip/rknn-toolkit2.git 或者直接去github下载压缩文件,解压即可。

论文翻译:ICLR-2024 PROVING TEST SET CONTAMINATION IN BLACK BOX LANGUAGE MODELS

PROVING TEST SET CONTAMINATION IN BLACK BOX LANGUAGE MODELS https://openreview.net/forum?id=KS8mIvetg2 验证测试集污染在黑盒语言模型中 文章目录 验证测试集污染在黑盒语言模型中摘要1 引言 摘要 大型语言模型是在大量互联网数据上训练的,这引发了人们的担忧和猜测,即它们可能已