cvpr专题

CVPR 2024最新论文分享┆YOLO-World:一种实时开放词汇目标检测方法

论文分享简介 本推文主要介绍了CVPR 2024上的一篇论文《YOLO-World: Real-Time Open-Vocabulary Object Detection》,论文的第一作者为Tianheng Cheng和Lin Song,该论文提出了一种开放词汇目标检测的新方法,名为YOLO-World。论文通过引入视觉-语言建模和大规模预训练解决了传统YOLO检测器在固定词汇检测中的局限性。论

(已开源-CVPR 2024)YOLO-World: Real-Time Open-Vocabulary Object Detection

169期《YOLO-World Real-Time Open-Vocabulary Object Detection》 You Only Look Once (YOLO) 系列检测模型是目前最常用的检测模型之一。然而,它们通常是在预先定义好的目标类别上进行训练,很大程度上限制了它们在开放场景中的可用性。为了解决这一限制,本文引入了 YOLO-World,通过视觉语言建模和大规模数

【CVPR‘24】深度补全:Flexible Depth Completion for Sparse and Varying Point Densities

【CVPR'24】深度补全:Flexible Depth Completion for Sparse and Varying Point Densities 摘要1. 引言3. 方法3.1 基础深度估计架构3.2 基于亲和度的偏移校正3.3 校正置信度预测3.4 联合深度估计与完成3.5 损失 4. 实验4.1 数据集和评估指标4.2 实验概述4.3 消融研究 参考文献 摘要

【CVPR‘24】DeCoTR:使用 2D 和 3D 注意力增强深度补全

DeCoTR: Enhancing Depth Completion with 2D and 3D Attentions DeCoTR: Enhancing Depth Completion with 2D and 3D Attentions 中文解析摘要介绍方法方法3.1 问题设置3.2 使用高效的 2D 注意力增强基线3.3 3D中的特征交叉注意力点云归一化位置嵌入 3.4 捕捉 3D

【CVPR‘24】BP-Net:用于深度补全的双边传播网络,新 SOTA!

【CVPR'24】BP-Net:用于深度补全的双边传播网络,新 SOTA! 摘要介绍方法1. 总体架构2. 双边传播模块(Bilateral Propagation Module)深度参数化参数生成先验编码 3. 多模态融合(Multi-modal Fusion)4. 深度细化(Depth Refinement)5. 损失函数 结果与分析结论 论文地址:https://arxiv.

2009-CVPR - Image deblurring and denoising using color priors

项目地址:http://neelj.com/projects/twocolordeconvolution/ 没有代码=_= 微软研究院 非盲去模糊基于MAP超拉普拉斯先验+颜色先验 文章首先分析了Levin等人使用超拉普拉斯分布惩罚图像梯度(次线性惩罚函数),相比高斯分布更能建模自然图像0峰重尾梯度分布(the zero-peaked and heavy tailed gradient dis

BVS:多强联手,李飞飞也参与的超强仿真数据生成工具,再掀数据狂潮 | CVPR 2024

BEHAVIOR Vision Suite(BVS)是一个新型工具包,旨在系统评估和全面理解计算机视觉模型。研究人员能够在场景、对象和相机级别控制各种参数,有助于创建高度定制的数据集。 来源:晓飞的算法工程笔记 公众号 论文: BEHAVIOR Vision Suite: Customizable Dataset Generation via Simulation 论文地址:http

CVPR 2024盛况空前,上海科技大学夺得最佳学生论文奖,惊艳全场

CVPR 2024盛况空前!上海科技大学夺得最佳学生论文奖,惊艳全场! 会议之眼 快讯 2024 年 CVPR (Computer Vision and Pattern Recogntion Conference) 即国际计算机视觉与模式识别会议,于6月17日至21日正在美国西雅图召开。CVPR是计算机视觉和模式识别领域的顶级会议之一。与ICCV和ECCV并称为计算机领域的

CVPR 2024第三弹:李飞飞教授惊喜亮相,CVPR之家乐队火爆演奏惊艳全场

CVPR 2024第三弹:小编与李飞飞教授惊喜同框,"CVPR之家"乐队火爆演奏惊艳全场! 会议之眼 快讯 2024 年 CVPR (Computer Vision and Pattern Recogntion Conference) 即国际计算机视觉与模式识别会议,于6月17日至21日正在美国西雅图召开。CVPR是计算机视觉和模式识别领域的顶级会议之一。与ICCV和ECC

CVPR 2024第三弹:小编与李飞飞教授惊喜同框,CVPR之家乐队火爆演奏惊艳全场

CVPR 2024第三弹:小编与李飞飞教授惊喜同框,"CVPR之家"乐队火爆演奏惊艳全场! 会议之眼 快讯 2024 年 CVPR (Computer Vision and Pattern Recogntion Conference) 即国际计算机视觉与模式识别会议,于6月17日至21日正在美国西雅图召开。CVPR是计算机视觉和模式识别领域的顶级会议之一。与ICCV和ECC

CVPR最佳学生论文!1千万张图像、跨越45万+物种的超大数据集,多模态模型BioCLIP实现零样本学习

不同于传统学术领域对期刊发表的重视,计算机界,尤其是机器学习、计算机视觉、人工智能等领域,顶级会议才是王道,无数「热门研究方向」、「创新方法」都将从这里流出。 作为计算机视觉乃至人工智能领域最具学术影响力的三大顶会之一,今年的国际计算机视觉与模式识别会议 (CVPR) 从会议规模到接受论文数量,都刷新了此前记录。 活动现场,图源:Dan Goldman 根据 CVPR 官方的最新公告,C

CVPR 2020:物体检测论文精选

点击上方“AI公园”,关注公众号,选择加“星标“或“置顶” 作者:Derrick Mwiti 编译:ronghuaiyang 导读 最近的CVPR 2020在推动物体检测前进方面有相当多的贡献。在这篇文章中,我们将看到几篇特别令人印象深刻的论文。 A Hierarchical Graph Network for 3D Object Detection on Point Clouds 这篇

CVPR 2020: 移动端机器学习的研究实现

点击上方“AI公园”,关注公众号,选择加“星标“或“置顶” 作者:Derrick Mwiti 编译:ronghuaiyang 导读 边缘设备上的机器学习是未来的一大方向。 在最近结束的2020年CVPR会议上,有很多优秀的计算机视觉研究。在本文中,我们将重点关注与移动或与边缘计算相关的任务和内容。虽然并非所有这些论文都直接接触到移动相关的应用,但它们对移动端机器学习的影响是巨大的。它们推

[CVPR论文介绍] BASNet:边缘感知的显著性物体检测

点击上方“AI公园”,关注公众号,选择加“星标“或“置顶” 作者:Jae Duk Seo 编译:ronghuaiyang 导读 和昨天的那篇U²Net同作者,但是更早一点。 大多数深度学习方法→在显著性预测时侧重于区域预测→但现在他们创建了一个新的损失函数→也考虑了目标的边界。 显著性预测→我们人类擅长于此→关注给定的图像或视频中的“重要”目标。(但没有很多方法考虑目标的边界)。现在有很

Selective Kernel Networks(CVPR-2019)

摘要 提出了一种动态选择机制,允许每个神经元根据输入信息的多个尺度自适应调整感受野大小。设计了一种称为选择核(SK)单元的结构块,利用softmax attention 对不同核大小的多个分支进行融合。对这些分支的不同attention产生融合层神经元有效感受野的不同大小。多个SK单元被堆叠成一个称为选择性核的网络SKNets。 文章提出了一种非线性方法,从多个内核中聚合信息,实现神经元的自适应

Talk|CVPR‘24 Oral:超越3D - Point Transformer V3中的多模态特征提取新构想

本期为TechBeat人工智能社区第599期线上Talk。  北京时间6月12日(周三)20:00,香港大学博士生—吴虓杨的Talk已经准时在TechBeat人工智能社区开播! 他与大家分享的主题是: “超越3D - Point Transformer V3中的多模态特征提取新构想”,他通过PTv3的两个核心思想——骨干网络设计的规模准则与非结构化数据的序列化技术,探究3D点云骨干网络作为一种多

【CVPR 2020】用于目标检测的统一样本加权网络

喜欢就关注我们吧! 随着CVPR 2020论文结果的公布,我们也将紧跟CVPR的步伐为大家带来一系列论文的解读。今天为大家解读的是一篇来自中科大和京东研究院关于目标检测的论文《Learning a Unified Sample Weighting Network for Object Detection》 喜欢的话,记得帮我们转发一下哦~ 摘要         区域采样或加权对于现代基于

注意力机制篇 | YOLOv8改进之在C2f模块引入反向残差注意力模块iRMB | CVPR 2023

前言:Hello大家好,我是小哥谈。反向残差注意力模块iRMB是一种用于图像分类和目标检测的深度学习模块。它结合了反向残差和注意力机制的优点,能够有效地提高模型的性能。在iRMB中,反向残差指的是将原始的残差块进行反转,即将卷积操作和批量归一化操作放在了后面。这样做的好处是,可以提高模型的非线性表达能力,同时减少了参数量。🌈         目录

51-49 CVPR 2024 | OMG:通过混合控制器实现开放词汇的运动生成

23年12月,腾讯联合上海科技大学联合发布OMG:Towards Open-vocabulary Motion Generation via Mixture of Controllers,从零样本开放词汇文本提示中生成引人注目的动作。这款控制器关键思想是将 pretrain-then-finetune 范式运用到文本-运动的生成中,主要贡献是扩大了模型和数据集大小,以及引入motion Contr

CVPR 小样本土地覆盖制图 张洪艳教授团队获挑战赛冠军

提出了一个广义的基于少镜头分割的框架,以更新高分辨率土地覆盖制图中的新类,分为三个部分:(a)数据预处理:对基础训练集和新类的少镜头支持集进行分析和扩充;(b)混合分割结构:将多基学习器和改进的投影到正交原型(POP)网络相结合,增强基类识别能力,并从不足的标签数据中挖掘新类;(c)终极融合:基础学习器和POP网络的语义分割结果得到了合理的融合。 少样本语义分割(FSS)在给定一些注释支持示

CVPR 2008 best papers

l   Best Student Poster Runner-up (最佳学生Poster亚军)Manifold-manifold distance with application to face recognition based on image set, Ruiping Wang, Shiguang Shan, Xilin Chen, Wen Gao l   Best Student P

CVPR 2024 - Rethinking the Evaluation Protocol of Domain Generalization

CVPR 2024 - Rethinking the Evaluation Protocol of Domain Generalization 论文:https://arxiv.org/abs/2305.15253原始文档:https://github.com/lartpang/blog/issues/8 这篇文章主要讨论了领域泛化评估协议的重新思考,特别是如何处理可能存在的测试数据信息泄

计算机常见的六大会议介绍:CVPR/ICCV/ECCV;NeurIPS/ICML/ICLR

计算机常见的六大会议介绍:CVPR/ICCV/ECCV;NeurIPS/ICML/ICLR CVPR、ICCV和ECCV是计算机视觉领域顶级的三个国际会议,而NeurIPS、ICML和ICLR则是机器学习领域最具影响力的三个国际会议。下面是它们的详细介绍: 计算机视觉领域 CVPR (Computer Vision and Pattern Recognition) 主办方:IEEE频率:

CVPR 2021 顶会冠军图像分割算法全解密

来源:DataFunTalk本文约1400字,建议阅读5分钟 本文为大家介绍 CVPR 2021 顶会冠军图像分割算法。 以Tesla为首的全球各大新势力造车企业最近简直火的不能再火,过山车似的股价也足以证明各界对自动驾驶行业炽烈的期待! 而Tesla经过多方面权衡最终采用纯视觉识别的方案,这种方案相比激光雷达方案有更低成本以及更强的统一性。而图像分割技术,作为视觉识别技术中举足轻重的模块,

CVPR 2024 | Retrieval-Augmented Open-Vocabulary Object Detection

CVPR 2024 - Retrieval-Augmented Open-Vocabulary Object Detection 论文:https://arxiv.org/abs/2404.05687代码:https://github.com/mlvlab/RALF原始文档:https://github.com/lartpang/blog/issues/13 本文提出了一种新的开放词汇目标检测

2013_CVPR_BoF meets HOG Feature Extraction based on Histograms of Oriented p.d.f Gradients for Imag

最近看到一篇较新的基于BOF的改进的特征提取算法,来自cvpr'2013,从大的方面来讲,这篇paper的算法改进主要包括以下几个方面: 1.BOF算法采用把特征映射到word上达到降维的目的,然后统计图像的word直方图,这篇文献采用计算特征的pdf(概率密度函数)的方法获得特征的表达,其中计算pdf采用KDE(核密度估计)的算法。一幅图像用一个pdf来表示。 2.求pdf的梯度:对p