petrv2专题

旷视提出PETRv2:统一的多摄像头3D感知框架

原文链接:https://www.techbeat.net/article-info?id=3698 作者:刘迎飞、wangeniusky 本文提出了一个统一的纯视觉3D感知框架PETRv2。基于PETR,PETRv2探究了利用历史帧的信息来进行时序建模,大幅度地提升了3D物体检测的性能。具体来说,我们扩展了PETR中所提出的3D position embedding (3D PE)来进行

【自动驾驶】PETR/PETRv2/StreamPETR论文分析

1.PETR PETR网络结构如下,主要包括image-backbone, 3D Coordinates Generator, 3D Position Encoder, transformer Decoder 1.1  Images Backbone 采用resnet 或者 vovNet,下面的x表示concatenate  1.2  3D Coordinates Generato