首页
Python
Java
前端
数据库
Linux
Chatgpt专题
开发者工具箱
petrv2专题
旷视提出PETRv2:统一的多摄像头3D感知框架
原文链接:https://www.techbeat.net/article-info?id=3698 作者:刘迎飞、wangeniusky 本文提出了一个统一的纯视觉3D感知框架PETRv2。基于PETR,PETRv2探究了利用历史帧的信息来进行时序建模,大幅度地提升了3D物体检测的性能。具体来说,我们扩展了PETR中所提出的3D position embedding (3D PE)来进行
阅读更多...
【自动驾驶】PETR/PETRv2/StreamPETR论文分析
1.PETR PETR网络结构如下,主要包括image-backbone, 3D Coordinates Generator, 3D Position Encoder, transformer Decoder 1.1 Images Backbone 采用resnet 或者 vovNet,下面的x表示concatenate 1.2 3D Coordinates Generato
阅读更多...