本文主要是介绍【只谈干货】KITTI 3D Object Label解析,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
最近项目用到了3D MOT (multi-object tracking),尝试了一个还不错的开源方法,但是这个方法的输入是KITTI的3D Object格式,因此研究了一下,其中有一些细节在此记录下来。
1. 官方解析
- 下图第一个红框位置是2D_bbox: [x_min, y_min, x_max, y_max]
- 下图第二个红框位置是3D信息: [h, w, l, x, y, z, rot_y]
2. 详解3D Label
- 3D坐标系为相机坐标系(x轴朝右,y轴朝下,z轴朝前),如下图所示。
- h, w, l分别为3D_bbox的高 宽 长。长和宽可以按照物体的朝向来区分,如汽车的长是朝向方向bbox的长度。
- x, y, z为3D_bbox底面中心的坐标。
- rot_y表示的是3D_bbox绕y轴的转角。参考下图右侧的俯视图,转角为朝向向量与x轴之间的夹角,顺时针为正,逆时针为负。朝向向量定义为沿着3D_bbox长度(l)方向,物体后部指向前部的向量。
References
- https://blog.csdn.net/rhyijg/article/details/108385676
- https://github.com/bostondiditeam/kitti/blob/master/resources/devkit_object/readme.txt
这篇关于【只谈干货】KITTI 3D Object Label解析的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!