petrv2专题

旷视提出PETRv2：统一的多摄像头3D感知框架

原文链接：https://www.techbeat.net/article-info?id=3698 作者：刘迎飞、wangeniusky 本文提出了一个统一的纯视觉3D感知框架PETRv2。基于PETR，PETRv2探究了利用历史帧的信息来进行时序建模，大幅度地提升了3D物体检测的性能。具体来说，我们扩展了PETR中所提出的3D position embedding （3D PE）来进行

【自动驾驶】PETR/PETRv2/StreamPETR论文分析

1.PETR PETR网络结构如下，主要包括image-backbone, 3D Coordinates Generator, 3D Position Encoder, transformer Decoder 1.1 Images Backbone 采用resnet 或者 vovNet,下面的x表示concatenate 1.2 3D Coordinates Generato