基于变形残差的大视差图像拼接 K. -Y. Lee and J. -Y. Sim, "Warping Residual Based Image Stitching for Large Parallax," 2020 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), Seattle, WA, USA, 20
Alleviation of Gradient Exploding in GANs: Fake Can Be Real 解决问题:GAN的梯度爆炸、模式崩溃问题。 解决方法:在一个mini batch 中 close pairs 多的位置选取假样本,认定其为真样本,再进行训练,来有效防止不平衡分布的产生(FARGAN)。 Cooling-Shrinking Attack: Blinding
图像分析新方法:“频域学习”(Learning in the Frequency Domain) 就是省略图像压缩/解压缩中计算量最大的步骤,直接利用频域特征来进行图像推理,减少系统中模块之间的数据传输量,从而提升系统性能。输入的数据量更小,深度神经网络在图像分类/分割任务上的精度反而提升了。 论文地址:https://arxiv.org/pdf/2002.12416.pdf 摘要:
本文转载自机器之心。 阿里巴巴达摩院在自动驾驶 3D 物体检测方面又有新成果发布。近日,计算机视觉顶会 CVPR 2020 接收论文结果发布,达摩院一篇名为《Structure Aware Single-Stage 3D Object Detection from Point Cloud》的论文入选。 该论文提出了一个通用、高性能的检测器,首次实现 3D 物体检测精度与速度的兼得,有效提
Multiple Object Tracking by Flowing and Fusing 通过光流和融合实现多目标跟踪 摘要: 大多数的多目标跟踪(MOT)方法都是为两个子任务计算单独的目标特征:目标方向的运动估计和成对的再识别(Re-ID)。由于视频帧之间的目标数目不确定,这两个子任务在端到端深度神经网络(DNNs)中都很难有效地扩展。针对上述问题,本文设计了一种端到端DNN跟踪方
CVPR2020: CascadePSP: Toward Class-Agnostic and Very High-Resolution Segmentation via Global and Local Refinement 题目:通过全局和局部优化进行超高分辨率的图像分割 论文地址:https://arxiv.org/abs/2005.02551 代码地址:https://githu