本文主要是介绍论文阅读——Mask DINO(cvpr2023),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
DINO是检测,Mask DINO是检测+分割。
几个模型对比:
传统的检测+分割中,检测头和分割头是平行的,Mask DINO使用二分图匹配bipartite matching提高匹配结果的准确性。
box对大的类别不计算损失,因为太大了,会带坏模型。模型一样预测,但是损失取其他类别的平均数。
Backbone:ResNet-50 and SwinL,SwinL SOTA
We use the same multi-scale setting as in DINO [37] to use 4 scales in ResNet-50-based models and 5 scales in SwinL-based models.
这篇关于论文阅读——Mask DINO(cvpr2023)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!