Superpoint Transformer for 3D Scene Instance Segmentation

本文主要是介绍Superpoint Transformer for 3D Scene Instance Segmentation，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

Abstract

现有的大多数方法通过扩展用于3D物体检测或3D语义分割的模型来实现3D实例分割。然而，这些非直接的方法存在两个缺点：1) 不精确的边界框或不令人满意的语义预测限制了整体3D实例分割框架的性能。2) 现有方法需要一个耗时的中间聚合步骤。为了解决这些问题，本文提出了一种基于Superpoint Transformer的全新端到端3D实例分割方法，命名为SPFormer。它将点云中的潜在特征组合成超点，并通过查询向量直接预测实例，而不依赖于物体检测或语义分割的结果。该框架的关键步骤是一个具有transformers的新颖查询解码器，它可以通过超点交叉注意机制捕获实例信息并生成实例的超点掩码。通过基于超点掩码的二分匹配，SPFormer可以在没有中间聚合步骤的情况下实现网络训练，从而加速网络。在ScanNetv2和S3DIS基准上的大量实验证明我们的方法简洁而高效。值得注意的是，SPFormer在ScanNetv2隐藏测试集的mAP方面超过了最先进的方法 $\%$ ，同时保持快速推断速度（每帧

这篇关于Superpoint Transformer for 3D Scene Instance Segmentation的文章就介绍到这儿，希望我们推荐的文章对编程师们有所帮助！

原文地址:
本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.chinasem.cn/article/601002。如若内容造成侵权/违法违规/事实不符，请联系我们进行投诉反馈，一经查实，立即删除！我们的邮箱：23002807@qq.com